Zprávy - Psychologický ústav AV ČR Tomáš Urbánek Optimální škálování Testu sémantického výběru Roč. 7, 2001, č. 1 ISSN: 1211-8818
AKADEMIE VĚD ČESKÉ REPUBLIKY PSYCHOLOGICKÝ ÚSTAV VEVEŘÍ 97, 602 00 BRNO tel.: 05/41636281 e-mail: tour@iach.cz Zprávy Optimální škálování Testu sémantického výběru Tomáš Urbánek Roč. 7, 2001, č. 1 ISSN: 1211-8818
Optimální škálování Testu sémantického výběru Tomáš Urbánek Psychologický ústav AV ČR Veveří 97, 602 00 Brno Úvod O tom, že Test sémantického výběru by se mohl stát atraktivní psychodiagnostickou metodou, se zmiňuje Smékal (1990). Uvádí také původní metodu zpracování výsledků testu, která se do té doby šířila patrně pouze ústním podáním a na základě manuálu od neznámého autora. Tato metoda spočívá ve výběru vhodné dvojice referenčních pojmů, zjištění počtu shodných obrázků každého pojmu s těmito referenčními pojmy a konečně zakreslení jednotlivých pojmů do pravoúhlé mřížky těmito referenčními pojmy definované. To, že zmíněný postup je hrubě zavádějící, se autor již pokoušel (Urbánek, 1999; 2000) doložit. V tomto sdělení se pokusí popsat jednu z alternativních metod, která by mohla být užitečná jak pro výzkum formálních (psychometrických) a obsahových (teoreticky relevantních) vlastností tohoto testu, tak pro jeho praktické použití v psychodiagnostice. Administrace testu sémantického výběru Test sémantického výběru je tvořen sadou verbálních podnětů a sadou šestnácti obrázků. Verbální podněty mohou představovat vhodně vybrané pojmy, osoby z rodinné konstelace, z pracovního nebo školního kolektivu probanda, případně konstrukty získané pomocí metody repertoárových mřížek. Obrázky tvoří jednoduché symboly (viz obr. 1). Úkolem probanda je pro každý verbální podnět vybrat vhodné obrázky v původní podobě to bylo osm obrázků pro každý podnět (Smékal, 1990), autor však navrhuje, aby tento počet byl ponechán částečně na volbě samotného probanda (např. stanovením rozmezí vybraných obrázků na 4-12). 1
Obr. 1: Obrázky v Testu sémantického výběru Data, která tímto způsobem pro každého probanda vzniknou, představuje seznam verbálních podnětů, ve kterém je pro každý podnět uveden seznam obrázků, které k němu byly vybrány. Tento seznam lze upravit do podoby tabulky společného výskytu verbálních podnětů a obrázků, čímž se sice ztratí informace o pořadí voleb obrázků pro jednotlivé pojmy, ale vytvoří se možnost takto vzniklou tabulku analyzovat jako tabulku podobností mezi obrázky a pojmy, což je základní podoba dat používaná v psychosémantice pro účely tzv. rekonstrukce individuálních sémantických prostorů (Šmelev, 1983). V tabulkách 1 a 2 je zobrazen příklad konverze seznamu, který uvádí Smékal (tab. 1; podle Smékala, 1990), na tabulku společných výskytů (tzv. incidencí, Nishisato, 1994). Každá položka v seznamu vlastně vstupuje jako jednotka do příslušné buňky definované verbálním podnětem a obrázkem. Tab. 1: Tabulka vstupních dat podle Smékala (1990) 1. Já 1 2 3 4 7 14 15 16 2. Láska 1 6 8 9 10 12 13 15 3. Nebezpečí 2 3 4 5 10 12 15 16 4. Nenávist 2 3 4 5 7 10 11 12 5. Poznání 1 2 5 6 9 11 12 15 6. Psychologie 1 2 5 6 7 9 11 15 7. Radost 1 2 6 8 9 11 13 14 8. Sebeovládání 2 3 6 7 9 11 14 16 9. Smutek 2 3 5 7 10 11 14 16 10. Umění 1 2 7 8 9 11 13 15 2
Tab. 2: Incidenční tabulka dat podle Smékala (1990) Obrázky Verb. podněty O1 O2 O3 O4 O5 O6 O7 O8 O9 O10 O11 O12 O13 O14 O15 O16 Celkem Já 1 1 1 1 0 0 1 0 0 0 0 0 0 1 1 1 8 Láska 1 0 0 0 0 1 0 1 1 1 0 1 1 0 1 0 8 Nebezpečí 0 1 1 1 1 0 0 0 0 1 0 1 0 0 1 1 8 Nenávist 0 1 1 1 1 0 1 0 0 1 1 1 0 0 0 0 8 Poznání 1 1 0 0 1 1 0 0 1 0 1 1 0 0 1 0 8 Psychologie 1 1 0 0 1 1 1 0 1 0 1 0 0 0 1 0 8 Radost 1 1 0 0 0 1 0 1 1 0 1 0 1 1 0 0 8 Sebeovládání 0 1 1 0 0 1 1 0 1 0 1 0 0 1 0 1 8 Smutek 0 1 1 0 1 0 1 0 0 1 1 0 0 1 0 1 8 Umění 1 1 0 0 0 0 1 1 1 0 1 0 1 0 1 0 8 Celkem 6 9 5 3 5 5 6 3 6 4 7 4 3 4 6 4 80 Pozn.: V tabulce 2 jsou z důvodů úspory místa názvy obrázků nahrazeny symboly O1 (Slunce), O2 (Měsíc), O3 (Mříž), O4 (Červ), O5 (Hrob), O6 (Loďka), O7 (Pavučina), O8 (Ústa). O9 (Strom), O10 (Dýka), O11 (Oko), O12 (Had), O13 (Květina), O14 (Ryba), O15 (Dům) a O16 (Voda). Výhodnost takto upravených dat spočívá v tom, že umožňují zpracování pomocí vhodných statistických metod. Šmelev (1983) uvádí, že lze uvažovat o následujících dvou způsobech organizace individuálních sémantických prostorů: 1) paradigmatickém, u kterého je každý objekt (v tomto případě verbální podnět nebo obrázek) umístěn v prostoru definovaném vhodnými souřadnicemi, takže na každý objekt se používají stejná kritéria; 2) hierarchickém, ve kterém se na různé skupiny objektů uplatňují různá kritéria a výslednou strukturu lze zobrazit jako stromový graf zvláštním případem takové struktury může být stromový graf o hloubce 1, ve kterém se vytvoří několik shluků na stejné úrovni. Každému způsobu organizace významů by měla odpovídat vhodná metoda statistické analýzy dat, dávající výsledky homomorfní s očekávanou strukturou. Pro paradigmatický způsob organizace významů je nejvhodnější metodou nějaká metoda analýzy, která jednotlivým objektům přiřazuje souřadnice faktorová analýza, mnohorozměrné nebo optimální škálování. Pro hierarchický způsob organizace je nejvhodnější některá metoda shlukové analýzy nebo různé další metody empirické klasifikace (např. algoritmus CHAID apod.). Metoda, které je věnována tato práce, předpokládá paradigmatickou formu organizace individuálních sémantických prostorů. Tento předpoklad je zřejmě nutné dále testovat, aby se vymezily hranice jeho platnosti např. pro jaký sémantický materiál nebo pro jaké osoby je možné ho považovat za platný. Nicméně dále popsaná metoda představuje jednu z možností, jak tento předpoklad metodologicky uchopit. 3
Vlastnosti optimálního škálování individuální incidenční matice Optimální škálování incidenční matice, jejíž příklad je uveden v tabulce 2, nebo konkrétněji tzv. korespondenční analýza takového formátu dat (van de Geer, 1993a; 1993b), není ničím jiným než analýzou hlavních komponent pro dvě skupiny kategoriálních proměnných (jednu sadu představují volby obrázků pro zvolené verbální podněty, druhou sadu představují pojmy, pro které byly zvoleny jednotlivé obrázky) nebo také nelineární analýzou hlavních komponent kategorií dvou nominálních proměnných. Cílem tohoto typu analýzy je najít pro jednotlivé objekty (verbální podněty a obrázky) takové souřadnice, které budou maximalizovat lineární korelaci mezi obrázky a verbálními podněty, což je podle autora implicitní předpoklad tvůrce a uživatelů Testu sémantického výběru (totiž že volbami obrázků pro jednotlivé verbální podněty se projevují důležité individuální zákonitosti psychiky daného probanda). Na základě unáhlené úvahy by se mohlo zdát (a skutečně byl tento názor na počátku století mezi statistiky rozšířen), že vhodnou volbou souřadnic je možné dosáhnout libovolné hodnoty korelace mezi jednou a druhou sadou objektů, tedy i korelace představující dokonalý vztah (r = 1). Později bylo ale dokázáno, že pro každou incidenční tabulku existuje maximální korelace mezi dvěma sadami objektů, která je obecně menší než 1 (van de Geer, 1993a; 1993b). Metoda optimálního škálování je v současnosti již podrobně rozpracována v mnoha publikacích (např. van de Geer, 1993a; 1993b; Nishisato, 1994) a v této práci je možné uvést pouze zlomek jejích vlastností. Přesto je nutné ještě dodat, že optimální škálování hledá souřadnice analyzovaných objektů obecně v několika dimenzích maximální počet dimenzí je dán minimem z počtů objektů v obou sadách, od kterého se odečte 1. To znamená, že každá dimenze představuje jeden aspekt vzájemného vztahu obou sad objektů. V praxi se patrně osvědčí pouze několik málo dimenzí (2-3). Důležitou vlastností metody je přitom nekorelovanost jednotlivých dimenzí. Uvedené vlastnosti naznačují důvod, proč bývá korespondenční analýza nazývána někdy faktorovou analýzou kategoriálních dat. Numerický postup Postup, pomocí kterého lze nalézt optimální souřadnice objektů (verbálních podnětů a obrázků) v předem stanoveném počtu dimenzí, se nazývá metoda recipročních průměrů (reciprocal averaging) nebo také metoda alterujících nejmenších čtverců (alternating least squares) (Nishisato, 1994). Její základní princip využívá dalších důležitých vlastností 4
hledaného řešení (v následujícím textu půjde už konkrétně o obrázky a verbální podněty Testu sémantického výběru): 1) V každé dimenzi se souřadnice všech obrázků rovnají váženým aritmetickým průměrům souřadnic těch verbálních podnětů, pro které byly tyto obrázky vybrány, a naopak souřadnice jednotlivých verbálních podnětů se rovnají váženým aritmetickým průměrům obrázků, které byly daným verbálním podnětům přiřazeny. Tato vlastnost se odráží v názvu metody recipročních průměrů. 2) V první dimenzi řešení se prostřednictvím hledání vhodných souřadnic maximalizuje lineární korelace mezi verbálními podněty a obrázky, což se provádí tak, že se postupně hledá optimální regresní přímka závislosti verbálních podnětů na obrázcích, potom regresní přímka závislosti obrázků na verbálních podnětech, potom opět závislost verbálních podnětů na obrázcích atd. Z toho důvodu se metodě říká také metoda alterujících nejmenších čtverců. Tato metoda je základem několika statistických procedur, z nichž nejjednodušší (a pro data z Testu sémantického výběru postačující) je metoda korespondenční analýzy. Tato metoda je součástí různých statistických počítačových programů, jako jsou např. SPSS nebo BMDP. Protože jsou ale tyto softwarové produkty poměrně specializované a obsahují množství dalších procedur, které nejsou pro popisovanou metodu potřebné (a také nepatří k nejlevnějším), je třeba popsat postup, který by se dal realizovat s minimálním softwarovým vybavením. Celý postup obsahuje několik kroků, které lze opakovat pro každou následující dimenzi. Nejprve je to volba vhodných počátečních hodnot souřadnic pro zvolenou sadu objektů (např. pro obrázky se zvolí jejich pořadová čísla), od kterých začne hledání řešení. Potom se pokračuje tak, že se souřadnice pro verbální podnět vypočte jako vážený průměr souřadnic obrázků, které byly pro daný verbální podnět vybrány. Potom se postupuje stejným způsobem pro souřadnice obrázků vypočítají se jako průměry souřadnic verbálních podnětů, pro které byl daný obrázek vybrán. Celý postup se opakuje střídavě pro sadu obrázků a verbálních podnětů tak dlouho (tzv. iterace), dokud se souřadnice mění dokud není dosaženo tzv. konvergence. Aby se nestalo, že by hodnoty souřadnic neustále rostly nebo oscilovaly, uplatňuje se transformace, která zajišťuje, aby v každé iteraci měly souřadnice v rámci každé sady nulový vážený průměr (od souřadnic se odečte jejich průměrná hodnota) a maximální absolutní hodnotu 1 (hodnoty souřadnic se dělí maximem z jejich absolutních hodnot). 5
Po nalezení optimálních souřadnic verbálních podnětů a obrázků se vypočte korelace reprezentující vztah mezi oběma sadami. Potom se původní incidenční matice transformuje tak, že se od jejích jednotlivých buněk odečte hodnota představující část vztahu mezi řádkovými a sloupcovými kategoriemi tabulky vysvětlenou první dimenzí řešení. Takto upravená matice pak tvoří novou incidenční tabulku (tedy data), kterou lze použít pro hledání optimálních souřadnic v další dimenzi. Celý postup tak lze opakovat od začátku, až do dosažení maximálního počtu dimenzí. Po zjištění optimálních souřadnic verbálních podnětů a obrázků v každé dimenzi je třeba tyto souřadnice transformovat tak, aby bylo možné obě skupiny objektů (verbálních podnětů a obrázků) zobrazit společně v jednom grafu. Příklad postupu V této práci bude k ilustraci celého postupu použit příklad již uvedený v tab. 1 (podle Smékala, 1990) a tab. 2 (incidenční tabulka). Vstupní data představuje právě incidenční tabulka a marginální (řádkové a sloupcové) součty. Vzhledem k tomu, že použitá data byla získána procedurou, která nutí probanda vybrat ke každému verbálnímu podnětu přesně 8 obrázků, jsou všechny řádkové součty rovny hodnotě 8. Sloupcové součty se od sebe liší a vyjadřují v podstatě popularitu jednotlivých obrázků. Počáteční hodnoty a první iterace Vzhledem k tomu, že Test sémantického výběru je tvořen variabilním počtem verbálních podnětů, ale vždy stejným počtem obrázků, budou počáteční hodnoty zvoleny pro obrázky (pokud bychom se ale rozhodli zvolit počáteční hodnoty pro verbální podněty, na celém postupu by to nic nezměnilo). Budou použita pořadová čísla obrázků. Celý postup volby počátečních hodnot je shrnut v tab. 3: 6
Tab. 3: Volba počátečních hodnot Obrázek Počáteční hodnota Po odečtení váženého průměru Po dělení maximem z absolutní hodnoty Slunce 1-7 -0,875 Měsíc 2-6 -0,750 Mříž 3-5 -0,625 Červ 4-4 -0,500 Hrob 5-3 -0,375 Loďka 6-2 -0,250 Pavučina 7-1 -0,125 Ústa 8 0 0,000 Strom 9 1 0,125 Dýka 10 2 0,250 Oko 11 3 0,375 Had 12 4 0,500 Květina 13 5 0,625 Ryba 14 6 0,750 Dům 15 7 0,875 Voda 16 8 1,000 Vážený průměr 8 0 0,000 Minimum 1-7 -0,875 Maximum 16 8 1,000 Postup je tedy jednoduchý nejprve se zvolí počáteční hodnoty pro každý obrázek (dobré je volit pro každý objekt jinou hodnotu), vypočte se jejich vážený průměr (v tomto případě 8), který se v druhém kroku od každé z počátečních hodnot odečte, z těchto výsledných hodnot se vybere maximální absolutní hodnota (tedy 8), a tou se všechny hodnoty z druhého kroku vydělí. Tím ve třetím kroku vzniknou počáteční hodnoty souřadnic pro každý obrázek, které mají tu vlastnost, že jejich vážený průměr je roven 0 a všechny patří do intervalu od 1 do 1. Výpočet váženého průměru probíhá tak, že se jednotlivé hodnoty souřadnic násobí počtem objektů (řádkovým nebo sloupcovým součtem podle toho, zda se jedná o verbální podněty nebo obrázky), tyto hodnoty se sečtou a dělí celkovým počtem provedených voleb (tzn. celkovým součtem incidenční tabulky v tomto případě 80). Konkrétně v tomto případě je postup výpočtu váženého průměru pro počáteční hodnoty souřadnic obrázků následující: 6 1+ 9 2 + 5 3 + 3 4 + 5 5 + 5 6 + 6 7 + 3 8 + 80 6 9 + 4 10 + 7 11+ 4 12 + 3 13 + 4 14 + 6 15 + 4 16 + 80 = 8 Je zjevné, že tyto souřadnice jsou zcela závislé na volbě počátečních hodnot, a tak jsou naprosto libovolné. V dalších krocích je proto nutné tyto počáteční hodnoty korigovat daty. Např. pro pojem Já byly vybrány obrázky s pořadovými čísly 1 (Slunce), 2 (Měsíc), 3 (Mříž), 4 (Červ), 7 (Pavučina), 14 (Ryba), 15 (Dům) a 16 (Voda). Souřadnice pojmu Já pak 7
bude vypočtena jako vážený průměr souřadnic uvedených osmi obrázků. Pro pojem Já je výsledná souřadnice rovna: 1 ( 0,875) + 1 ( 0,75) + 1 ( 0,625) + 1 ( 0,5) + 1 ( 0,125) + 1 0,75 + 1 0,875 + 1 1 x 1Já = = 8 = 0,0313 Tímto způsobem se postupuje také u souřadnic ostatních pojmů, čímž se získají hodnoty uvedené ve druhém sloupci tabulky 4 (Průměr souřadnic obrázků). Tyto hodnoty je opět nutné centrovat odečtením jejich aritmetického průměru ve sloupci 3 (Po odečtení průměru) a normalizovat dělením maximální absolutní hodnotou sloupce 3, čímž ve sloupci 4 (Po dělení maximem z absolutní hodnoty) vzniknou souřadnice verbálních podnětů. Tab. 4: První iterace souřadnic verbálních podnětů Verbální podnt Prmr Po odetení souadnic prmru obrázk Po dlení maximem z absolutní hodnoty Já -0,0313-0,0313-0,2 Láska 0,1563 0,1563 1,0 Nebezpeí 0,0469 0,0469 0,3 Nenávist -0,1563-0,1563-1,0 Poznání -0,0469-0,0469-0,3 Psychologie -0,1250-0,1250-0,8 Radost 0,0000 0,0000 0,0 Sebeovládání 0,0625 0,0625 0,4 Smutek 0,0625 0,0625 0,4 Umní 0,0313 0,0313 0,2 Prmr 0,0000 0,0000 0,0 Minimum -0,1563-0,1563-1,0 Maximum 0,1563 0,1563 1,0 Opět je zřejmé, že vzhledem k tomu, že souřadnice obrázků byly zvoleny libovolně, také souřadnice verbálních podnětů jsou touto libovolností zatíženy. Z toho důvodu se také počáteční souřadnice obrázků korigují pomocí dat a souřadnic verbálních podnětů uvedených v tabulce 4. Opět se pro každý obrázek vypočte vážený průměr, a to ze souřadnic těch verbálních podnětů, pro které byl vybrán. Např. obrázek Slunce byl vybrán pro verbální podněty Já, Láska, Poznání, Psychologie, Radost a Umění. Jejich souřadnice budou použity pro výpočet průměru: x 1Slunce 1 ( 0,2) + 1 1,0 + 1 ( 0,3) + 1 ( 0,8) + 1 0,0 + 1 0,2 = 6 = 0,0167 8
Opakováním výpočtu vážených průměrů pro všechny obrázky a jejich centrováním a normalizací jako v předchozích případech se získají nové, korigované hodnoty souřadnic obrázků uvedené v tabulce 5. Tab. 5: První iterace souřadnic obrázků Obrázek Průměr souřadnic verbálních podnětů Po odečtení průměru Po dělení maximem z absolutní hodnoty Slunce -0,0167-0,0167-0,0417 Měsíc -0,1111-0,1111-0,2778 Mříž -0,0200-0,0200-0,0500 Červ -0,3000-0,3000-0,7500 Hrob -0,2800-0,2800-0,7000 Loďka 0,0600 0,0600 0,1500 Pavučina -0,1667-0,1667-0,4167 Ústa 0,4000 0,4000 1,0000 Strom 0,0833 0,0833 0,2083 Dýka 0,1750 0,1750 0,4375 Oko -0,1571-0,1571-0,3929 Had 0,0000 0,0000 0,0000 Květina 0,4000 0,4000 1,0000 Ryba 0,1500 0,1500 0,3750 Dům 0,0333 0,0333 0,0833 Voda 0,2250 0,2250 0,5625 Průměr 0,0000 0,0000 0,0000 Minimum -0,3000-0,3000-0,7500 Maximum 0,4000 0,4000 1,0000 Další postup V předchozích odstavcích byla popsána jednotka postupu numerického odhadu, které se říká iterace, v tomto případě konkrétně první iterace optimálního škálování výsledků Testu sémantického výběru. Tímto způsobem se pokračuje dále právě získané souřadnice obrázků z 1. iterace se spolu s daty použijí pro výpočet 2. iterace souřadnic verbálních podnětů, ty se spolu s daty použijí pro výpočet 2. iterace souřadnic obrázků atd. Tento postup spolehlivě konverguje, tzn. vede k odhadu jedinečných hodnot souřadnic objektů (verbálních podnětů a obrázků). To neznamená, že všechny objekty musí mít nutně různé souřadnice. Pokud by např. dvěma verbálním podnětům byly přiřazeny totožné sady obrázků, tyto verbální podněty by měly stejné souřadnice. Podobně by tomu bylo u dvou obrázků přiřazených stejným verbálním podnětům (viz např. v tab. 5 souřadnice obrázků Květina a Ústa ). Jedinečnost hodnot souřadnic neznamená nic jiného, než vlastnost řešení, při kterém se při různých počátečních hodnotách souřadnic na konci řešení dospěje pokaždé ke stejným optimálním hodnotám souřadnic. To je možné díky tomu, že do procesu odhadu neustále korektivně vstupují data a uplatňují se ve stále stejných vztazích, matematickém modelu optimálního škálování kategoriálních dat. Vlastnostmi iteračních postupů odhadu parametrů 9
matematicko-statistických modelů (a dalšími otázkami) se zabývá numerická matematika, vědecká disciplína, která zasahuje do mnoha vědních odvětví. Základní otázkou každého iteračního postupu je, kdy se má s výpočty skončit, kdy jsou optimální odhady souřadnic objektů skutečně optimální v tom smyslu, že na nich už nelze nic zlepšit (v kontextu použitého modelu). V praxi se používají různá kritéria, např. rozdíl mezi sumami čtverců souřadnic získaných při dvou po sobě jdoucích iteracích. Pokud tento rozdíl klesne pod předem stanovenou (rozumně nízkou) hodnotu, průběh odhad optimálních hodnot souřadnic se zastaví. Optimální škálování souřadnic má tu vlastnost, že po několika málo iteracích (v nejhorším případě po několika desítkách) se hodnoty souřadnic začínají ustalovat a mění se pouze nepatrně (na čtvrtém a vyšším desetinném místě). Pokud se pro výpočet použije např. vhodný tabulkový procesor, je možné hodnoty souřadnic v každé iteraci zobrazit a průběh řešení kontrolovat vizuálně přímo v průběhu výpočtu. V tabulce 6 jsou obsaženy hodnoty souřadnic objektů (obrázků a verbálních podnětů) v prvních deseti iteracích. V posledních dvou iteracích už se hodnoty souřadnic buď nemění vůbec nebo až na třetím desetinném místě. Po dalších deseti iteracích už by změny probíhaly až na pátém desetinném místě, což jsou z hlediska interpretace výsledků zcela jistě nepatrné změny. 10
Tab. 6: Hodnoty souřadnic v prvních 10-ti iteracích Iterace Objekt 1 2 3 4 5 6 7 8 9 10 Slunce -0,042 0,261 0,407 0,470 0,493 0,501 0,503 0,504 0,505 0,505 Měsíc -0,278-0,157-0,120-0,111-0,110-0,109-0,110-0,110-0,110-0,110 Mříž -0,050-0,365-0,576-0,678-0,719-0,734-0,740-0,741-0,742-0,742 Červ -0,750-0,558-0,703-0,805-0,849-0,864-0,869-0,870-0,870-0,870 Hrob -0,700-0,564-0,484-0,444-0,427-0,420-0,416-0,415-0,414-0,414 Loďka 0,150 0,265 0,381 0,454 0,487 0,499 0,503 0,504 0,505 0,505 Pavučina -0,417-0,265-0,224-0,223-0,227-0,230-0,232-0,233-0,233-0,233 Ústa 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 Strom 0,208 0,317 0,456 0,531 0,562 0,573 0,576 0,577 0,578 0,578 Dýka 0,438-0,058-0,305-0,403-0,436-0,446-0,448-0,448-0,448-0,448 Oko -0,393-0,116 0,021 0,076 0,095 0,101 0,103 0,103 0,103 0,103 Had 0,000-0,122-0,156-0,158-0,153-0,148-0,145-0,143-0,142-0,141 Květina 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 Ryba 0,375 0,150-0,029-0,117-0,153-0,168-0,175-0,177-0,179-0,179 Dům 0,083 0,036 0,094 0,130 0,145 0,151 0,153 0,154 0,155 0,155 Voda 0,563-0,189-0,499-0,627-0,675-0,693-0,700-0,702-0,703-0,704 Já -0,200-0,182-0,399-0,530-0,594-0,621-0,632-0,637-0,639-0,640 Láska 1,000 1,000 0,992 0,923 0,915 0,918 0,922 0,924 0,926 0,926 Nebezpečí 0,300-0,245-0,727-0,882-0,938-0,956-0,961-0,962-0,963-0,963 Nenávist -1,000-0,758-0,811-0,818-0,832-0,838-0,839-0,840-0,840-0,840 Poznání -0,300-0,342-0,029 0,192 0,287 0,324 0,338 0,343 0,346 0,347 Psychologie -0,800-0,489-0,082 0,170 0,267 0,302 0,314 0,318 0,319 0,320 Radost 0,000 0,712 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 Sebeovládání 0,400 0,056-0,132-0,190-0,210-0,220-0,225-0,227-0,229-0,230 Smutek 0,400-0,163-0,575-0,711-0,765-0,786-0,795-0,799-0,801-0,802 Umění 0,200 0,410 0,763 0,845 0,870 0,877 0,879 0,880 0,881 0,881 Po vypočtení hodnot souřadnic objektů v první dimenzi je možné přejít k výpočtu souřadnic v dalších dimenzích. U optimálního škálování platí, že první dimenze obsahuje nejdůležitější část informace obsažené v datech. Kdyby se rezignovalo na hledání dalších dimenzí, bylo by možné výsledky hledání optimálních souřadnic první dimenze interpretovat jako implicitní pořadí, které proband dává objektům. Dá se ovšem předpokládat, že organizace významů není jednorozměrná, ale obsahuje mnohem více dimenzí v psychosémantice se takové dimenze nazývají někdy sémantické příznaky. Známé faktory Hodnocení, Síly a Aktivity zjištěné při faktorových analýzách dat pocházejících z výzkumů metody sémantického diferenciálu (Osgood, Suci a Tannenbaum, 1957) jsou v podstatě takovými sémantickými příznaky organizujícími prostor denotativních složek pojmů. Další dimenze řešení Aby tedy bylo možné získat souřadnice v další dimenzi optimálního řešení, je nutné upravit původní matici dat tak, že se z ní odečte informace vysvětlená první dimenzí řešení. Taková úprava předpokládá výpočet sloupcových a řádkových sum čtverců a výpočet maximální korelace mezi verbálními podněty a obrázky pro danou dimenzi. Tato korelace se 11
také nazývá vlastní nebo singulární hodnota a je analogická s vlastními hodnotami, na jejichž základě se ve faktorové analýze rozhoduje o počtu extrahovaných faktorů. Pro každou buňku incidenční tabulky se pak provede úprava hodnoty, která je v ní obsažena.nově získaná incidenční tabulka se dále analyzuje na základě výše popsaného postupu, čímž se získají souřadnice objektů (verbálních podnětů a obrázků) ve druhé dimenzi. V tomto postupu lze pokračovat dále až do dosažení maximálního počtu dimenzí (minimum z počtu verbálních podnětů a obrázků bez jedné) nebo do té doby, dokud data obsahují nějakou informaci. To se pozná tak, že procedura odhadu zkolabuje. Obvykle se ale neodhadují souřadnice pro maximální počet dimenzí. Postupné snižování korelací (vlastních hodnot) v po sobě následujících dimenzích je spolehlivým indikátorem klesající hodnoty dimenzí. Postup úpravy incidenční matice před odhadem souřadnic v další dimenzi bude popsán a ilustrován pro první dimenzi. Nejprve je nutné vypočítat sumu čtverců pro verbální podněty a pro obrázky. Suma čtverců verbálních podnětů se rovná odmocnině z podílu celkové sumy hodnot v incidenční tabulce a skalárního součinu řádkových sum incidenční tabulky (počtů obrázků přiřazených jednotlivým verbálním podnětům) a čtverců souřadnic verbálních podnětů v příslušné dimenzi, suma čtverců obrázků se analogicky rovná odmocnině z podílu celkové sumy hodnot v incidenční tabulce a skalárního součinu sloupcových sum incidenční tabulky (počtů verbálních podnětů, pro které byl vybrán ten který obrázek) a čtverců souřadnic obrázků v příslušné dimenzi. Tyto vztahy vyjadřují následující vzorce: Suma čtverců verbálních podnětů C VP r ij i= 1 j= 1 = r 2 a k s k k= 1 s a 12
Suma čtverců obrázků C O r ij i= 1 j= 1 = s 2 a ms m m= 1 s a kde r je počet řádků incidenční matice (tzn. počet verbálních podnětů), s je počet sloupců incidenční matice (tzn. počet obrázků), a ij je hodnota na i-tém řádku a j-tém sloupci incidenční matice, a k je řádkový součet v k-tém řádku incidenční matice, s k je souřadnice k- tého verbálního podnětu, a m je sloupcový součet v m-tém sloupci incidenční matice a s m je souřadnice m-tého obrázku. Pro zjednodušení byly z vzorců vynechány indexy, které by označovaly aktuální dimenzi, pro které se hodnoty počítají. Pro data analyzovaná v této práci byly v první dimenzi vypočteny následující hodnoty: C VP = 1,336 C O = 1,983 Uvedené hodnoty sum čtverců pro verbální podněty a obrázky se v dané dimenzi použijí pro adjustaci souřadnic verbálních podnětů a obrázků tak, aby vyjadřovaly relativní důležitost sady verbálních podnětů a sady obrázků pro variabilitu obsaženou v datech. Provede se to jednoduše původně zjištěné souřadnice se vynásobí sumou čtverců příslušné sady. Opět je možné vyjádřit tyto vztahy vzorci: Souřadnice verbálních podnětů c VPk = s k C VP Souřadnice obrázků c Om = s m C O kde c VPk je adjustovaná souřadnice k-tého verbálního podnětu (k = 1,, r) a c Om je adjustovaná souřadnice m-tého obrázku (m = 1,, s). Ostatní symboly mají stejný význam jako v předchozích vzorcích. 13
a 8: Pro analyzovaná data byly vypočteny adjustované souřadnice uvedené v tabulkách 7 Tab. 7: Adjustované souřadnice verbálních podnětů Verbální podnět Adjustovaná souřadnice Já -0,8567 Láska 1,2395 Nebezpečí -1,2864 Nenávist -1,1220 Poznání 0,4642 Psychologie 0,4278 Radost 1,3363 Sebeovládání -0,3082 Smutek -1,0723 Umění 1,1778 Tab. 8: Adjustované souřadnice obrázků Obrázek Adjustovaná souřadnice Slunce 1,0005 Měsíc -0,2187 Mříž -1,4732 Červ -1,7256 Hrob -0,8211 Loďka 1,0012 Pavučina -0,4637 Ústa 1,9828 Strom 1,1454 Dýka -0,8886 Oko 0,2042 Had -0,2797 Květina 1,9828 Ryba -0,3574 Dům 0,3077 Voda -1,3967 Nyní je nutné pomocí adjustovaných souřadnic upravit incidenční matici, která byla použita pro odhad souřadnic v dané dimenzi. To se provede tak, že se každý prvek incidenční matice vynásobí adjustovanými souřadnicemi příslušného verbálního podnětu a obrázku. Pro každý prvek incidenční matice dané dimenze se vypočte jeho upravená hodnota podle následujícího vzorce: b ij = a ij c VPi c Oj 14
kde a ij je prvek v i-tém řádku a j-tém sloupci původní incidenční matice, c VPi je adjustovaná souřadnice i-tého verbálního podnětu a c Oj je adjustovaná souřadnice j-tého obrázku. Ve vzorcích opět není zohledněno, o kterou dimenzi se jedná. V případě analyzovaných dat je upravená incidenční matice (označená B) uvedena v tabulkách 9a a 9b. Tab. 9a: Upravená incidenční matice 1. část Slunce Měsíc Mříž Červ Hrob Loďka Pavučina Ústa Já -0,8571 0,1874 1,2620 1,4783 0 0 0,3972 0 Láska 1,2401 0 0 0 0 1,2410 0 2,4576 Nebezpečí 0 0,2814 1,8950 2,2198 1,0562 0 0 0 Nenávist 0 0,2454 1,6529 1,9362 0,9213 0 0,5203 0 Poznání 0,4645-0,1015 0 0-0,3812 0,4648 0 0 Psychologie 0,4280-0,0936 0 0-0,3512 0,4283-0,1984 0 Radost 1,3370-0,2923 0 0 0 1,3379 0 2,6496 Sebeovládání 0 0,0674 0,4540 0 0-0,3086 0,1429 0 Smutek 0 0,2345 1,5796 0 0,8804 0 0,4972 0 Umění 1,1784-0,2576 0 0 0 0-0,5461 2,3354 Tab. 9b: Upravená incidenční matice 2. část Strom Dýka Oko Had Květina Ryba Dům Voda Já 0 0 0 0 0 0,3062-0,2636 1,1965 Láska 1,4197-1,1013 0-0,3467 2,4576 0 0,3813 0 Nebezpečí 0 1,1430 0 0,3598 0 0-0,3958 1,7967 Nenávist 0 0,9970-0,2291 0,3138 0 0 0 0 Poznání 0,5317 0 0,0948-0,1298 0 0 0,1428 0 Psychologie 0,4900 0 0,0873 0 0 0 0,1316 0 Radost 1,5306 0 0,2728 0 2,6496-0,4776 0 0 Sebeovládání -0,3530 0-0,0629 0 0 0,1102 0 0,4305 Smutek 0 0,9528-0,2189 0 0 0,3832 0 1,4976 Umění 1,3491 0 0,2405 0 2,3354 0 0,3624 0 Suma všech prvků upravené incidenční matice B je použita při výpočtu optimální hodnoty korelace mezi řádky a sloupci (zde verbálními podněty a obrázky) incidenční matice v dané dimenzi. Její vzorec je následující: R = r k= 1 a r s i= 1 j= 1 b ij s 2 k c VPk m= 1 a c 2 m Om kde r je počet řádků a s počet sloupců incidenční (a tím i upravené incidenční) matice, b ij je prvek z i-tého řádku a j-tého sloupce upravené incidenční matice, a k je součet k-tého řádku 15
incidenční matice, c VPk je adjustovaná souřadnice k-tého verbálního podnětu, a m je součet m-tého sloupce incidenční matice a c Om je adjustovaná souřadnice m-tého obrázku. Ani v tomto vzorci není zohledněna dimenze, pro kterou se hodnota korelace počítá. Pro data analyzovaná v této práci se optimální hodnota korelace mezi verbálními podněty a obrázky v první dimenzi rovná 0,631. Je třeba zdůraznit, že tato korelace je také vlastní (singulární) hodnotou v nelineární analýze hlavních komponent, takže vlastně představuje relativní důležitost dimenze vzhledem k dimenzím ostatním. Novou incidenční matici pro výpočet souřadnic v další dimenzi lze získat tak, že se od každého prvku původní incidenční matice odečte součin adjustovaných souřadnic příslušného verbálního podnětu a obrázku (tzn. příslušného řádku a sloupce), očekávané četnosti a vlastní hodnoty (korelace verbálních podnětů a obrázků) pro aktuální dimenzi. Symbolicky je tento vztah možné vyjádřit jako: a (t+ 1) ij = a (t) ij R (t) c (t) VPi c (t) Oj e ij kde a (t+1) ij je prvek v i-tém řádku a j-tém sloupci incidenční matice použité pro výpočet souřadnic v dimenzi (t+1), a (t) ij je prvek v i-tém řádku a j-tém sloupci incidenční matice použité pro výpočet souřadnic v t-té dimenzi, R (t) je korelace řádků a sloupců incidenční matice v t-té dimenzi, c (t) VPi je adjustovaná souřadnice i-tého verbálního podnětu v t-té dimenzi, c (t) Oj je adjustovaná souřadnice j-tého obrázku v t-té dimenzi a e ij je očekávaná četnost v i-tém řádku a j-tém sloupci matice očekávaných četností E (viz dále). V tomto vzorci již bylo nutné zdůraznit dimenze, pro které se výpočet provádí. Z předchozího vztahu je patrná důležitá zákonitost. Vzhledem k tomu, že u každé analýzy hlavních komponent se postupně pro každou další dimenzi snižují vlastní hodnoty (tzn. korelace řádků a sloupců), od hodnot v buňkách incidenční matice se pro každou další dimenzi odečítá v průměru stále nižší hodnota (kromě toho je průměr adjustovaných souřadnic nulový a očekávané četnosti jsou pro daný řádek a sloupec konstantní). Další důležitá zákonitost spočívá v tom, že celá analýza může skončit před vyčerpáním maximálního počtu dimenzí tak, že incidenční matice neobsahuje již žádný vztah. V takovém případě se incidenční matice pro následující dimenzi rovná matici očekávaných četností. Hodnota očekávané četnosti pro každou buňku se vypočítá jako součin sumy příslušného řádku se sumou příslušného sloupce dělený sumou celé incidenční matice. 16
V případě analyzovaných dat je např. řádková suma pro pojem Já rovna 8, sloupcová suma pro 1. obrázek (Slunce) je rovna 6, celková suma tabulky je rovna 80, takže očekávaná četnost pro první řádek a první sloupec incidenční matice je rovna 8 6 e 11 = = 0,6. 80 Tento vztah je možné napsat obecně jako e ij a a = a i j kde e ij je očekávaná četnost v i-tém řádku a j-tém sloupci matice očekávaných četností E, a i je suma i-tého řádku incidenční matice, a j je suma j-tého sloupce incidenční matice a a je celková suma přes všechny řádky a sloupce incidenční matice. Pro analyzovaná data je matice očekávaných četností uvedena v tabulce 10. Tab. 10: Očekávané četnosti pro analyzovaná data O1 O2 O3 O4 O5 O6 O7 O8 O9 O10 O11 O12 O13 O14 O15 O16 S Já 0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4 0,7 0,4 0,3 0,4 0,6 0,4 8 Láska 0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4 0,7 0,4 0,3 0,4 0,6 0,4 8 Nebezpečí 0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4 0,7 0,4 0,3 0,4 0,6 0,4 8 Nenávist 0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4 0,7 0,4 0,3 0,4 0,6 0,4 8 Poznání 0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4 0,7 0,4 0,3 0,4 0,6 0,4 8 Psychologie 0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4 0,7 0,4 0,3 0,4 0,6 0,4 8 Radost 0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4 0,7 0,4 0,3 0,4 0,6 0,4 8 Sebeovládání 0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4 0,7 0,4 0,3 0,4 0,6 0,4 8 Smutek 0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4 0,7 0,4 0,3 0,4 0,6 0,4 8 Umění 0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4 0,7 0,4 0,3 0,4 0,6 0,4 8 Celkem 6 9 5 3 5 5 6 3 6 4 7 4 3 4 6 4 80 Pozn.: V tabulce 10 jsou z důvodů úspory místa názvy obrázků nahrazeny symboly O1 (Slunce), O2 (Měsíc), O3 (Mříž), O4 (Červ), O5 (Hrob), O6 (Loďka), O7 (Pavučina), O8 (Ústa). O9 (Strom), O10 (Dýka), O11 (Oko), O12 (Had), O13 (Květina), O14 (Ryba), O15 (Dům) a O16 (Voda). Důležitou vlastnost matice očekávaných četností představuje fakt, že sloupcové a řádkové sumy součty stejné jako v případě incidenční matice, na jejímž základě byla matice očekávaných četností vypočtena. Pokud se tedy od incidenční matice pro výpočet souřadnic v první dimenzi (viz tab. 2) odečte matice očekávaných četností (tab. 10), ve které je každý prvek vynásoben vlastní hodnotou první dimenze (v tomto případě 0,631), adjustovanou souřadnicí pro daný verbální 17
podnět (tzn. řádek viz tab. 7) a obrázek (tzn. sloupec viz tab. 8). Výsledná incidenční matice vstupující do výpočtu souřadnic v druhé dimenzi je uvedena v tabulkách 11a a 11b. Tab. 11a: Incidenční matice pro výpočet souřadnic 2. dimenze 1. část Slunce Měsíc Mříž Červ Hrob Loďka Pavučina Ústa Já 1,3244 0,8936 0,6019 0,7202-0,2219 0,2706 0,8496 0,3215 Láska 0,5306 0,1539 0,5760 0,4048 0,3210 0,6086 0,2176 0,5349 Nebezpečí 0,4872 0,8402 0,4022 0,5799 0,6668 0,4063-0,2258 0,4827 Nenávist 0,4249 0,8607 0,4786 0,6336 0,7094 0,3544 0,8031 0,4211 Poznání 0,8242 1,0577 0,2157 0,1516 1,1202 0,8534 0,0815-0,1742 Psychologie 0,8380 1,0531 0,1988 0,1397 1,1108 0,8649 1,0751-0,1605 Radost 0,4939 1,1660 0,6210 0,4364 0,3461 0,5780 0,2345 0,4985 Sebeovládání 0,1167 0,9617 0,8568-0,1007-0,0798 1,0973 0,9459 0,1157 Smutek 0,4061 0,8668 0,5017-0,3502 0,7223 0,3386 0,8118 0,4024 Umění 0,5539 1,1463 0,5473 0,3847 0,3051-0,3720 1,2067 0,5580 Tab. 11b: Incidenční matice pro výpočet souřadnic 2. dimenze 2. část Strom Dýka Oko Had Květina Ryba Dům Voda Já 0,3714-0,1921 0,0772-0,0605 0,3215 0,9227 1,0998 0,6981 Láska 0,4626 1,2779-0,1118 1,0875 0,5349 0,1118 0,8557 0,4369 Nebezpečí 0,5577 0,7116 0,1160 0,9092 0,4827-0,1160 1,1498 0,5466 Nenávist 0,4865 0,7484 1,1012 0,9208 0,4211-0,1012 0,1307-0,3955 Poznání 0,7987 0,1041 0,9581 1,0328-0,1742 0,0419 0,9459 0,1636 Psychologie 0,8145 0,0959 0,9614 0,0302-0,1605 0,0386 0,9502 0,1508 Radost 0,4206 0,2996 0,8795 0,0943 0,4985 1,1205-0,1556 0,4710 Sebeovládání 1,1336-0,0691 1,0278-0,0218 0,1157 0,9722 0,0359 0,8914 Smutek 0,4649 0,7596 1,0967-0,0757 0,4024 0,9033 0,1249 0,6221 Umění 0,4893 0,2641 0,8938 0,0831 0,5580 0,1062 0,8628 0,4151 Matici uvedenou v tabulkách 11a a 11b lze použít jako vstupní matici na místě incidenční matice, ze které byly odhadovány souřadnice pro první dimenzi optimálního řešení. V okamžiku, kdy se tato matice bude blížit matici očekávaných četností (viz tab. 10), bude to znamenat, že v datech už není obsažena žádná informace, na základě které by se dala zkonstruovat další dimenze. Pokud se tato matice od matice očekávaných četností liší, lze postupovat dále a odhadovat souřadnice pro další dimenzi. Velmi často je tímto způsobem možné dospět až k maximálnímu počtu dimenzí, které je (jak bylo již několikrát uvedeno) rovno maximu z počtu řádků (verbálních podnětů) a sloupců (obrázků) bez jedné, což je v případě dat analyzovaných v této práci 9 dimenzí. Obecně se ale má za to (van de Geer, 1993a; 1993b), že při analýzách hlavních komponent má smysl uvažovat pouze o několika málo dimenzích. Kritérium, na základě kterého se dá o počtu dimenzí rozhodnout, je analogické s Cattelovým kritériem scree test (např. McDonald, 1991), ve kterém se počet dimenzí stanovuje na základě posouzení grafu 18
vlastních hodnot uspořádaných podle velikosti. Tyto hodnoty jsou pro analyzovaná data uvedeny v tabulce 12. Tab. 12: Vlastní hodnoty pro analyzovaná data Dimenze Vlastní hodnota 1 0,6309 2 0,4610 3 0,3690 4 0,3051 5 0,2683 6 0,1942 7 0,1613 8 0,1326 9 0,0839 Po zobrazení vlastních hodnot seřazených podle velikosti není v grafu 1 patrný žádný výrazný svah, který by naznačoval, kolik dimenzí lze odhadnout. To může naznačovat to, že v datech není obsažena žádná informace, kterou by stálo za to interpretovat. Velikost vlastních hodnot by pak naznačovala relativní důležitost jednotlivých dimenzí. Velice exaktní kritérium, na základě kterého lze rozhodnout o počtu dimenzí, spočívá v dekompozici hodnoty chí-kvadrát pro vztah mezi řádky a sloupci původní incidenční matice. Tato hodnota se dá rozdělit na komponenty obsažené v každé z dimenzí optimálního škálování. Pokud daná dimenze obsahuje statisticky významnou část chí-kvadrát, obsahuje hodnotnou část informace, a má smysl pro ni odhadovat souřadnice a interpretovat je. Celý postup není výpočetně složitější než postup naznačený v této práci, nicméně ji tematicky značně přesahuje. V případě analyzovaných dat ovšem hodnota chí-kvadrátu statisticky významná není (χ 2 = 80,00, df = 135, p = 1,000). To se podle názoru autora ani nedá očekávat, protože se jedná o řídce obsazenou tabulku. Posouzení adekvátnosti optimálního řešení ale nezávisí pouze na statistických nebo kvantitativních kritériích, ale také na teoretické hodnotě celého přístupu a validitě získaných výsledků v kontextu práce s individuálním klientem. Tyto otázky by měly být předmětem výzkumu. 19
Graf 1: Vlastní hodnoty Vlastní hodnota Vlastní hodnota 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1 2 3 4 5 6 7 8 9 Dimenze Grafické znázornění dvourozměrného řešení V tabulce 13 jsou uvedeny souřadnice pro první dvě dimenze optimálního škálování dat uvedených v tabulkách 1 a 2. Tyto hodnoty byly získány na základě postupu popsaného v předchozích odstavcích. 20
Tab. 13: Dvě dimenze optimálního škálování dat Objekt Dimenze I Dimenze II Slunce -0,6411-0,5102 Měsíc 0,9276 0,8115 Mříž -0,9627 0,8134 Červ -0,8397 0,6017 Hrob 0,3474 0,4891 Loďka 0,3201-0,0689 Pavučina 1,0000-0,4963 Ústa -0,2306-1,0000 Strom -0,8024-0,5286 Dýka 0,8814-0,1115 Oko 0,5046-0,0053 Had -0,1103-0,1715 Květina -0,7430-0,2243 Ryba -0,8703 0,4252 Dům -0,4141 0,3639 Voda 0,5049-0,1147 Já -0,2339-0,4448 Láska 1,0000 0,0694 Nebezpečí 0,5777-0,1296 Nenávist -0,4481 0,6124 Poznání 0,1030-0,2767 Psychologie -0,1411 1,0000 Radost 1,0000 0,0694 Sebeovládání -0,1803-0,9996 Smutek 0,1552 0,3272 Umění -0,7044-0,5009 Tyto souřadnice ještě nelze použít pro grafické znázornění, protože v této podobě nejsou obě sady objektů umístěny ve stejném prostoru (Nishisato, 1994). Aby bylo možné společné grafické znázornění, je třeba souřadnice transformovat do tvaru tzv. kanonického řešení, které má tu vlastnost, že souřadnice každého obrázku se rovná váženému průměru verbálních podnětů, u kterých byly použity, dělenému vlastní hodnotou příslušné dimenze. Souřadnice uvedené v tabulce 13 tuto vlastnost zatím nesplňují. Tohoto výsledku se dá docílit tak, že se rozsah souřadnic jedné ze sad objektů vhodným způsobem natáhne nebo smrští vzhledem k rozsahu hodnot souřadnic druhé sady. Přitom na absolutní délce os jednotlivých dimenzí v podstatě nezáleží. Je to jen otázka měřítka použitého pro dostatečně diferencované zobrazení objektů. Nejjednodušší postup, který navrhuje např. Nishisato (1994), spočívá v násobení souřadnic jedné sady objektů vlastní hodnotou příslušné dimenze. Tyto upravené souřadnice pak představují projekci určité sady do prostoru definovaného souřadnicemi objektů druhé sady. V tomto případě se budou vlastní hodnotou příslušné dimenze násobit souřadnice verbálních podnětů. Rozhodnutí je založeno na praktickém hledisku přehlednosti výsledného 21
grafu protože vlastní hodnota je nižší než 1, výsledné body grafu budou umístěny blíže středu, což je výhodnější u sady, která má méně prvků. Je však obecně možný i opačný postup. Výsledné souřadnice upravené na základě popsaného postupu jsou uvedeny v tabulce 14. Tab. 14: Výsledné souřadnice objektů Objekt Dimenze I Dimenze II Slunce 0.5046-0.0053 Měsíc -0.1103-0.1715 Mříž -0.7430-0.2243 Červ -0.8703 0.4252 Hrob -0.4141 0.3639 Loďka 0.5049-0.1147 Pavučina -0.2339-0.4448 Ústa 1.0000 0.0693 Strom 0.5777-0.1296 Dýka -0.4481 0.6124 Oko 0.1030-0.2767 Had -0.1411 1.0000 Květina 1.0000 0.0693 Ryba -0.1803-0.9996 Dům 0.1552 0.3272 Voda -0.7044-0.5009 Já -0.4044-0.2345 Láska 0.5852 0.3729 Nebezpečí -0.6073 0.3737 Nenávist -0.5297 0.2765 Poznání 0.2192 0.2247 Psychologie 0.2019-0.0317 Radost 0.6309-0.2281 Sebeovládání -0.1455-0.4595 Smutek -0.5062-0.2429 Umění 0.5561-0.0512 Tyto souřadnice byly použity při konstrukci grafu 2, který představuje rekonstrukci individuálního sémantického prostoru probanda, od kterého pocházejí analyzovaná data. Horizontální osa představuje dimenzi I, vertikální osa dimenzi II, obrázky jsou označeny čtvercem a verbální podněty kosočtvercem. 22
Graf 2: Rekonstrukce individuálního sémantického prostoru Had Dýka Červ Nebezpečí Hrob Láska Dům Nenávist Poznání Slunce Ústa Květina Psycholog Umění Loďka Strom Mříž Měsíc Já Oko Radost Smutek Pavučina S ebeovládání Voda Ryba Při pohledu na graf je třeba mít na paměti, že první dimenze je významnější než druhá v poměru, který vyjadřuje poměr jejich vlastních hodnot. Aby nebyl celý postup příliš složitý, nebyla prováděna další úprava souřadnic v jednotlivých dimenzích (např. opětovné násobení již jednou upravených souřadnic vlastními hodnotami dimenzí), je to však alternativa, která stojí v budoucnu za úvahu. Interpretace výsledků optimálního škálování závisí podle autora do značné míry na znalosti konkrétního probanda. Existují však obecná pravidla, která lze v takových případech použít (Kruskal a Wish, 1994). V zásadě lze výsledky interpretovat na základě charakteristik objektů umístěných na protilehlých pólech (lze nazvat pravidlem kontrastu) nebo na základě charakteristik objektů, které jsou umístěny blízko sebe (pravidlo podobnosti). Příklad interpretace na základě pravidla kontrastu: Např. na první dimenzi se verbální podněty Láska a Radost nacházejí v blízkosti pravého pólu dimenze spolu s obrázky Květina a Ústa, zatímco pojmy Nebezpečí, Nenávist a Smutek spolu s obrázky Červ, Mříž atd. jsou umístěny v blízkosti levého pólu. Možná interpretace by tedy mohla být založena na tomto zjištění (tato dimenze by mohla představovat individuální podobu dimenze hodnocení zjištěné v interpersonálních datech založených na použití sémantického diferenciálu). Pak se může jevit zajímavým zjištění, že verbální podnět Já se vyskytuje spíše 23
v blízkosti negativního pojmu dimenze. Interpretace druhé dimenze již není jednoznačná, o to by však bylo zajímavější se o ni pokusit na základě znalosti osoby, od které pocházejí data. Příklad interpretace na základě pravidla podobnosti: V grafu se nevyskytují příliš výrazně oddělené shluky, nicméně např. shluk verbálních podnětů Nebezpečí a Nenávist a obrázků Červ, Dýka a Hrob působí jednoznačně. Zajímavý je opět fakt, proč se verbální podnět Já nachází v blízkosti podnětu Smutek. Závěr Tato práce je věnována prezentaci postupu, který lze použít při zpracování dat získaných pomocí individuální administrace Testu sémantického výběru. Představuje jednu z možností, jak rekonstruovat individuální sémantický prostor pomocí metody optimálního škálování, které zobrazuje obrázky a verbální podněty ve společném grafu. Tento graf může představovat základ pro věcnou interpretaci individuálních výsledků. Uvedený postup lze zatím považovat pouze za návrh možné budoucí praxe používání Testu sémantického výběru. Nicméně je již jisté, že nějaký alternativní způsob zpracování výsledků tohoto testu bude třeba najít, protože stávající praxe je nevyhovující. Oprávněnost optimálního škálování bude v tomto případě ještě nutné doložit prostřednictvím empirických studií, které by byly schopny kriticky zhodnotit výsledky, které lze takovým postupem získat z hlediska jejich relevance pro psychologický výzkum a praxi. Relativní složitostí celého postupu by se nikdo neměl nechat odradit jeho rutinní používání je jen otázkou vhodné počítačové implementace. V době, kdy množství klasických psychologických metod administrují počítače, není problém představit si, že budou vznikat i metody, jejichž použití je na použití počítačů zcela závislé. Jejich hodnotu ovšem musí prokázat nejprve výzkum a potom praxe. Uvedený postup optimálního škálování pro výsledky Testu sémantického výběru je (jak už bylo uvedeno) pouze jedním z mnoha možných. Další logickou možností je uplatnit na takto vytvořená data některý z postupů shlukové analýzy. Postup optimálního škálování přitom není omezen pouze na data z Testu sémantického výběru. Lze ho s výhodou použít na jakoukoli incidenční (kontingenční) tabulku, ale i na matice pocházející ze sociometrických šetření atd. Jeho hodnota je v české psychologii patrně zatím značně nedoceněná. 24
Literatura: Geer, J. P. van de: Multivariate Analysis of Categorical Data: Theory. SAGE Publications, London, 1993a. Geer, J. P. van de: Multivariate Analysis of Categorical Data: Applications. SAGE Publications, London, 1993b. Kruskal, J. B., Wish, M.: Multidimensional Scaling. In: Lewis-Beck, M. S.: Basic Measurement, Sage Publications, London, 1994. Nishisato, S.: Elements of dual scaling. An introduction to practical data analysis. Lawrence Erlbaum Associates, Publishers. Hillsdale, New Jersey, 1994. Osgood, C. E., Suci, G. J., Tannenbaum, P, H,: The measurement of meaning. University of Illinois Press, Urbana, 1957. Smékal, V.: Psychosémantické metody. In: Maršálová, L., Mikšík, O. a kol.: Metodológia a metódy psychologického výskumu. Slovenské pedagogické nakladatelstvo, 1990. Šmelev, A. G.: Vveděnije v eksperimentaľnuju psichosemantiku. Izdatěľstvo moskovskogo universitěta, Moskva, 1983. Urbánek T.: Metodologické otázky zpracování testu sémantického výběru: předběžné sdělení. In: Blatný, M., Svoboda, M. (Ed.): Sociální procesy a osobnost 99': Sborník příspěvků. Masarykova universita, Brno, 1999. Urbánek, T: Possibilities of quantification of the Semasiological selection test. Studia psychologica, 42, 2000, 3, s. 283-288. 25
Souhrn Zpráva je věnována podrobné prezentaci postupu optimálního škálování dat pocházejících z individuální administrace Testu sémantického výběru. Nejprve je diskutována nutnost hledání takového postupu a uvedeny možné alternativy. Na konkrétních datech jsou pak prezentovány a ilustrovány jednotlivé kroky optimálního škálování. Získané výsledky jsou zobrazeny graficky a jsou naznačeny možné způsoby jejich interpretace. Na závěr je zdůrazněna nutnost empirického ověřování hodnoty tohoto přístupu. Klíčová slova: Optimální škálování, korespondenční analýza, Test sémantického výběru. Summary The report is aimed to detailed presentation of the optimal scaling technique on data coming from individual administration of the Semantic selection test. First, the need for search of such a technique is discussed, and possible alternatives are introduced. Individual steps of the optimal scaling technique are then presented and illustrated by means of particular data. The obtained results are graphically displayed and possible ways of their interpretation are suggested. Finally, there is conclusion that the empirical testing of this approach is necessary. Key words: Optimal scaling, correspondence analysis, Semantic selection test. 26