Masarykova univerzita

Podobné dokumenty
Slohové útvary se zřetelem ke komunikační situaci

Vzdělávací obsah vyučovacího předmětu

7. ročník. Český jazyk a literatura. Komunikační a slohová výchova. Vypravování uspořádání dějových prvků

Český jazyk a literatura komunikační a slohová výchova ročník TÉMA

Vyučovací předmět: Český jazyk a literatura Ročník: 9. Školní výstupy

Český jazyk a literatura

RVP ŠVP UČIVO - rozlišuje a příklady v textu dokládá nejdůležitější způsoby obohacování slovní zásoby a zásady tvoření českých slov

WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY

KORPUSOVÝ WORKSHOP. Václav Cvrček, Lucie Chlumská Univerzita Karlova v Praze VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT!

E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

Vyučovací předmět: Český jazyk a literatura Ročník: 6. Jazyková výchova

Prezentace slouží k zopakování učiva o slohových útvarech. Blíže popisuje některé základní slohové útvary, a to vyprávění, popis a charakteristiku.

Moravské gymnázium Brno s.r.o. Hana Blaudeová. Ročník 2. Datum tvorby Anotace. -prezentace určena pro učitele

Teorie komunikace - odborná komunikace. Vysokoškolské práce technického zaměření ( bakalářské a diplomové práce...) stať jádro odborného projevu

Vzdělávací obsah vyučovacího předmětu

Dataprojektor, jazykové příručky, pracovní listy

Logika a jazyk. filosofický slovník, Praha:Svoboda 1966)

Německý jazyk (rozšířená výuka cizích jazyků)

Slohové postupy ZPŮSOB ŘAZENÍ MYŠLENEK V JEDNOM PROMLUVOVÉM CELKU

Inovace výuky prostřednictvím šablon pro SŠ

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

1. Matematická logika

OPAKOVÁNÍ SLOHOVÝCH ÚTVARŮ I. Tento výukový materiál vznikl za přispění Evropské unie, státního rozpočtu ČR a Středočeského kraje

Český jazyk a literatura

STYL (SLOH) = ZPŮSOB VÝSTAVBY JAZYKOVÉHO PROJEVU (způsob zpracování obsahu a využití jazykových prostředků) Nauka o slohu se nazývá STYLISTIKA

Příklad z učebnice matematiky pro základní školu:

NÁVRHY TEMATICKÝCH PLÁNŮ. 1. ročník Počet hodin

E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO

Český jazyk a literatura - jazyková výchova

POSUDEK VEDOUCÍHO BAKALÁŘSKÉ PRÁCE

KDYŽ ZAČÍNÁME MLUVIT... Lingvistický pohled na rané projevy česky hovořícího dítěte. Lucie Saicová Římalová

Prezentace učiva o současné češtině ve školních učebnicích Gabriela Lefenda

MENSA GYMNÁZIUM, o.p.s. TEMATICKÉ PLÁNY TEMATICKÝ PLÁN (ŠR 2014/15)

Bakalářský seminář - 3

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Předmět: Konverzace v ruském jazyce

Jak lze v korpusech hledat doklady pro výzkum morfologie?

SLOHOVÁ VÝCHOVA Mgr. Soňa Bečičková

Český jazyk a literatura. 8. ročník. Komunikační a slohová výchova

Slohový útvar Výklad hypotézy Požadavky:

Reálné gymnázium a základní škola města Prostějova Školní vzdělávací program pro ZV Ruku v ruce

Vymezení pojmu komunikace

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Metodologie pedagogického výzkumu Téma číslo 2 Koncipování vlastního výzkumu

Ročníková práce. Metodika tvorby. Jan Divišek Alena Beňadiková

STUDIJNÍ OPORA K DISCIPLÍNĚ KORPUSOVÁ LINGVISTIKA. Katedra českého jazyka a literatury Pedagogické fakulty Univerzity Palackého

Výchovné a vzdělávací postupy vedoucí k utváření klíčových kompetencí:

RVP ŠVP UČIVO - samostatně pracuje s Pravidly českého pravopisu, se Slovníkem spisovné češtiny a s dalšími slovníky a příručkami

Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti

Očekávané výstupy z RVP Učivo Přesahy a vazby Dokáže pracovat se základními obecné poučení o jazyce (jazykové příručky)

Olympiáda v českém jazyce 45. ročník, 2018/2019

Marketingový výzkum. Ing. Martina Ortová, Ph.D. Technická univerzita v Liberci. Projekt TU v Liberci

Vzdělávací obsah vyučovacího předmětu

= vnímání lidí a mezilidských vztahů. Naučené, kultura, sociální prostředí.

2.3 Prezentace statistických dat (statistické vyjadřovací prostředky)

Psychologické základy vzdělávání dospělých

LISTOPAD Úvod do nauky o tvoření slov, PROSINEC Psaní velkých písmen

Logika 5. Základní zadání k sérii otázek: V uvedených tezích doplňte z nabízených adekvátní pojem, termín, slovo. Otázka číslo: 1. Logika je věda o...

ČJL KRITÉRIA HODNOCENÍ PÍSEMNÝCH PRACÍ

Český jazyk a literatura

Český jazyk pro 7. ročník

2. Množiny, funkce. Poznámka: Prvky množiny mohou být opět množiny. Takovou množinu, pak nazýváme systém množin, značí se

ODBORNÝ TEXT. doc. Mgr. Ing. Michal Tvrdoň, Ph.D. proděkan pro zahraniční styky Katedra ekonomie a veřejné správy

1. KRITÉRIA HODNOCENÍ ZKOUŠEK A DÍLČÍCH ZKOUŠEK SPOLEČNÉ ČÁSTI 1.1 ZPŮSOB VÝPOČTU A VYJÁDŘENÍ VÝSLEDKU HODNOCENÍ ZKOUŠEK SPOLEČNÉ ČÁSTI

Hodnocení profilové části maturitní zkoušky pro obor vzdělávání K/81 a K/48 (Gymnázium)

TR(2) Tabulka rovin ČG - 4. a 5. ročník ZŠ

Vzdělávací obsah vyučovacího předmětu

32. Výklad Vypracovala: PhDr. Miroslava Zajíčková, srpen 2013

Protetické v- v pražské mluvě. seminář Příprava a realizace interdisciplinárního výzkumu

OPAKOVÁNÍ SLOHOVÝCH ÚTVARŮ II. Tento výukový materiál vznikl za přispění Evropské unie, státního rozpočtu ČR a Středočeského kraje

Metody psaní odborného textu. Praktika odborného diskurzu

Jazyk a jazyková komunikace 1. ročník a kvinta

1. Matematická logika

Učební osnovy vyučovacího předmětu český jazyk a literatura se doplňují: 2. stupeň Ročník: osmý. Tematické okruhy průřezového tématu

Aktuální změny v didaktickém testu z češtiny 2015

Střední odborné učiliště a Střední odborná škola Hustopeče, Masarykovo nám. 1 Ing. Miriam Sedláčková Číslo

2. Přídavná jména Tři stránky tabulek obsahují 156 nejběžnějších anglických přídavných jmen.

Inovace studia obecné jazykovědy a teorie komunikace ve spolupráci s přírodními vědami. reg. č.: CZ.1.07/2.2.00/

2. Korpusový portál a volně dostupné nástroje

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Předmět: ANGLICKÝ JAZYK Ročník: 6.

Korpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105

Téma číslo 4 Základy zkoumání v pedagogice I. Pavel Doulík, Úvod do pedagogiky

SADA VY_32_INOVACE_CJ1

POLITICKÝ PROCES NA LOKÁLNÍ A REGIONÁLNÍ ÚROVNI

Olympiáda v českém jazyce 43. ročník, 2016/2017

Výchovné a vzdělávací strategie uplatňované v předmětu Mediální výchova

Ročník: 5. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby

CZ.1.07/1.5.00/

Další cizí jazyk. Ruský jazyk. Základní škola a Mateřská škola Havlíčkův Brod, Wolkerova 2941 Školní vzdělávací program. Oblast. Předmět

Závěrečná práce. Odborný styl

Umělecké aspekty larpu

Mgr. Petr Čadek, Mgr. Karel Šulc, Bc. Lukáš Javůrek, Hana Solarová

Stará a nová média, participace a česká společnost

Vyhledávání nebo nalezení informací

Gymnázium Jiřího Ortena, Kutná Hora

Hodnocení kvality logistických procesů

OPONENTSKÝ POSUDEK HABILITAČNÍ PRÁCE

Transkript:

Masarykova univerzita Filozofická fakulta Centrum počítačové lingvistiky Bakalářská diplomová práce 2013 Helena Palátová

Masarykova univerzita Filozofická fakulta Centrum počítačové lingvistiky Český jazyk se specializací počítačová lingvistika Frekvenční analýza českých floskuĺı na vybraných korpusech Bakalářská diplomová práce Helena Palátová Podzim 2013 Vedoucí práce: RNDr. Miloš Jakubíček

Prohlášení Prohlašuji, že tato diplomová práce je mým původním autorským dílem, které jsem vypracovala samostatně. Všechny zdroje, prameny a literaturu, které jsem při vypracování používala nebo z nich čerpala, v práci řádně cituji s uvedením úplného odkazu na příslušný zdroj. Brno, 1. prosince 2013

Poděkování Děkuji RNDr. Miloši Jakubíčkovi, vedoucímu této práce, za jeho čas, ochotu, trpělivost, stálý optimismus, pomoc s realizací práce i za moudré rady, které mi věnoval při vedení této diplomové práce. Děkuji za vše, čemu jsem se od něj během této doby měla možnost naučit. Dále své rodině a přátelům za vytrvalou podporu, doplňování zásob čokolády a naděje a za až nepochopitelné pochopení. Můj dík patří také všem lidem (známým i náhodným kolemjdoucím), kteří mě inspirovali k úvahám nad jazykem.

Kĺıčová slova floskule, klišé, korpus, korpusová lingvistika, CQL, frekvenční analýza, publicistický styl, aktualizace, automatizace, eufemismus, statistické metody

Obsah Obsah 1 Úvod 1 2 Teoretická východiska 3 2.1 Slovník floskulí.............................. 3 2.2 Problém vymezení pojmu floskule.................... 3 2.2.1 Justovo pojetí floskule...................... 3 2.2.2 Vlastnosti floskulí: květnatost, pozitivní konotace, nezávazná platnost a manipulace s fakty.................. 4 2.2.3 Vlastnosti floskulí: frekventovanost, naučenost a bezobsažnost 6 2.2.4 Vlastnosti floskulí: bezúčelnost................. 7 2.2.5 Publicistický styl a stylistická funkce floskule......... 7 2.2.6 Aktualizace a automatizace................... 8 2.2.7 Klišé................................ 9 2.3 Definice floskule pro tuto práci..................... 10 3 Praktická část 11 3.1 Postup výzkumu, použité metody.................... 11 3.1.1 Korpus, korpusová lingvistika.................. 12 3.1.2 Vybrané korpusy......................... 13 3.1.3 Vyhledávání pomocí dotazů v CQL.............. 14 3.2 Klasifikace floskulí............................ 15 3.3 Vyhledávání floskulí v korpusech.................... 17 3.4 Frekvenční analýza............................ 18 3.4.1 Vyhodnocení........................... 19 3.4.2 SYN................................ 20 3.4.3 CzechParl............................. 25 3.4.4 Komparace............................ 29 3.4.5 Trendovost a typy floskulí.................... 31 3.4.6 Frekventovanost floskulí..................... 32 4 Závěr 34 Seznam použitých zdrojů 38 Příloha A: Abecední seznam floskulí 43

Příloha B: Seznam floskulí s dotazy v CQL 44 Seznam floskulí s dotazy v CQL (atributový systém značkování)..... 48 Seznam floskulí s dotazy v CQL (poziční systém značkování)....... 52 Příloha C: Klasifikace floskulí 53 Floskule klasifikované podle formy...................... 55 Floskule klasifikované podle výskytu v tematicko-stylové sféře....... 58 Floskule klasifikované podle typu bezobsažnosti............... 59 Floskule klasifikované podle základního rysu floskulovitosti....... 61 Příloha D: Trendovost floskulí 62 SYN....................................... 62 Floskule se vzrůstajícím trendem (SYN )................ 62 Floskule s klesajícím trendem (SYN ).................. 63 Floskule s nulovou trendovostí (SYN )................. 63 CzechParl.................................... 65 Floskule se vzrůstajícím trendem (CzechParl)............. 65 Floskule s klesajícím trendem (CzechParl)............... 66 Floskule s nulovou trendovostí (CzechParl).............. 66 Komparace................................... 68

1. Úvod Hodně mluvit a hodně říkat není totéž. Homér Slova jsou jako listy na stromě kde je jich nejvíc, tam je nejméně ovoce. Goethe Floskulím (jejichž definicí, která není zcela triviálním úkolem, se zabývám v teoretické části této práce) zatím v českém lingvistickém prostředí nebylo věnováno mnoho pozornosti. Jedinou přímo na ně zaměřenou publikací je Velký slovník floskulí, jehož autorem je teatrolog a kritik Vladimír Just (2009). Nejedná se o odborné lexikografické dílo, jak by se podle názvu mohlo zdát, ale spíše o popularizačně zaměřený soubor kritických esejí, úvah a fejetonů, pojednávajících o vyjadřování zejména politiků a novinářů (obecněji o jazykových vadách, vyskytujících se zvláště v mediálních komunikátech). Floskule pokládám částečně za slohový nedostatek, ale také za záležitost lexikální roviny jazyka (problém nedostatečné slovní zásoby vedoucí k opakování frází). Mohou být důkazem špatných úmyslů mluvčích (jazykové manipulace), či naopak toho, že mluvčí nad tím, co říká, příliš nepřemýšlí, užívá jazyk ledabyle a příliš mechanicky. Řidší užívání floskulí by tudíž přispělo ke zkvalitnění stylu komunikace. Poukázání na tuto problematiku a na konkrétní nejfrekventovanější floskule je podle mého názoru důležité, protože je třeba, aby si mluvčí uvědomili, že záleží na tom, jak mluví, a že je nezbytné nad obsahem i formou řeči přemýšlet. Z důvodu negativního vlivu floskulí na kvalitu mezilidské komunikace považuji za užitečné podívat se na ně z frekvenčního úhlu pohledu a důkladně podložit floskule uvedené ve Velkém slovníku floskulí Vladimíra Justa korpusovým materiálem. V této práci si kladu za cíl provést frekvenční analýzu reálných výskytů českých floskulí, které byly uvedeny ve Velkém slovníku floskulí. Tato analýza by měla vést k prohloubení znalostí o floskulích, kterým dosud nebyla v lingvistice věnována (kromě kritik Justova slovníku) žádná pozornost. Celou práci jsem rozdělila na teoretickou a praktickou část. Nejprve se věnuji teoretickým východiskům (kapitola 2), v rámci nichž uvádím své stanovisko k samotnému Justovu dílu (2.1) a slovníkové definice floskule (2.2), které následně doplňuji o zevrubnou deskripci Justova vnímání tohoto pojmu (2.2.1). S pomocí dostupné odborné literatury analyzuji jednotlivé rysy floskulí: nejprve květnatost, pozitivní konotace, nezávaznou platnost a manipulaci s fakty (2.2.2), následně vysokou frekventovanost, naučenost a bezobsažnost (2.2.3) a nakonec bezúčelnost, bezdůvodnost užití (2.2.4). Jelikož se rozebírané floskule vyskytují převážně v textech publicistického stylu, zabývám se v další podkapitole (2.2.5) vybranými atributy této stylové sféry, výrazně 1

ovlivňujícími výběr výrazových prostředků, jež považuji za hlavní příčiny vzniku a užívání floskulí. Dále (2.2.6) popisuji procesy pro tuto stylovou oblast typické aktualizaci a automatizaci, které velmi úzce souvisejí s charakterem floskulí. Poté v podkapitole 2.2.7 srovnávám floskule s blízkými pojmy klišé a fráze. Teoretickou část uzavírám návrhem definice floskule (2.3), jež slouží zejména k ujednocení rozcházejících se hledisek uváděných ve slovnících a v další literatuře, které popisuji průběžně v předchozím textu práce. Vytvoření vyčerpávajícího výčtu floskulí však není cílem mé práce, pro její účely přebírám hesla Justova slovníku, a to z důvodu vysoké subjektivity při určování floskulí. V úvodu k praktické části (kapitola 3) podrobněji popisuji zvolené metody a způsob, jakým jsem během práce postupovala (3.1). Stručně charakterizuji v lingvistice poměrně nový metodologický přístup, korpusovou lingvistiku (3.1.1), a uvádím informace o korpusech vybraných k analýze floskulí (3.1.2). Následuje podkapitola 3.1.3, v níž se věnuji jazyku CQL, který slouží k vyhledávání jazykových jevů v korpusech a který jsem využívala k získání informací o frekvenci floskulí. V podkapitole 3.2 popisuji klasifikace, podle nichž jsem floskule roztřídila, a to z důvodu potřeby přehlednosti a možnosti později generalizovat výsledky frekvenční analýzy, určovat frekvenční vlastnosti jednotlivých typů floskulí. Následuje krátká podkapitola (3.3), věnující se specifikům vyhledávání floskulí v korpusech a poskytující komentář k mnou vytvořeným dotazům v CQL (uvedených v příloze B). Jádrem této práce je vypracovaná frekvenční analýza (provedená v podkapitole 3.4) floskulí vyhledaných v korpusech. Jsou zde popsány statistické metody Theil-Sen a Mann-Kendall, jež jsem při výzkumu využívala, také stručně představeny programy vytvořené za účelem automatického vyhodnocení údajů o frekvenci a o změnách v užívanosti floskulí (3.4.1). Poukáži na vzestupnou či sestupnou tendenci u frekvencí jednotlivých floskulí, poskytnu podklady k potvrzení nebo vyvrácení hypotézy pana Justa o jejich zvyšující se užívanosti. Pozornost věnuji frekvenčním trendům v užívání floskulí, nejprve v materiálu korpusů řady SYN (3.4.2), dále v datech z korpusu CzechParl (3.4.3), poté výsledky srovnávám (v 3.4.4). Dále popisuji frekvenční chování floskulí v rámci klasifikací (3.4.5) a uvádím nejfrekventovanější české floskule (3.4.6). V závěru (kapitola 4) shrnuji výsledky své bakalářské práce a navrhuji dílčí problémy, kterými je potřeba se v rámci problematiky floskulí dále zabývat. 2

2. Teoretická východiska 2.1 Slovník floskuĺı Jelikož Justovo dílo není lingvistickou prací, nemohu jej jako takovou posuzovat. Cílem mé práce není hodnotit Velký slovník floskulí, jeho teoretické a názorové podhoubí ani formální provedení. Protože však v práci využívám materiál slovníku a vycházím i z některých poznatků Vladimíra Justa, pokládám za nezbytné hned zpočátku ujasnit své stanovisko ohledně daného díla. Autor pod rouškou kritiky vyjadřování kritizuje mnohem více než floskule samotné celkovou politickou a společenskou situaci v naší zemi. Své hodnocení směřuje ke konkrétní formulaci určitého publicisty či politika, která se mu osobně nelíbí, ale ve skutečnosti jeho kritika míří hlouběji přímo k osobnosti užívající daný výrazový prostředek. Často mi jeho názor i vnímání připadá velmi subjektivní a nekonzistentní, co se jazyka týče. Za přínosný považuji především jeho přístup, kterým motivuje potřebně provokativním, přitažlivým a přístupným způsobem veřejnost přemýšlet nad tím, jak jako mluvčí zacházíme s jazykem a jak si ho měníme k obrazu svému. Sám Just však vyjadřuje potřebu vzniku díla odborného, ucelenějšího a propracovanějšího, zaměřeného na popis českých floskulí (pokud možno ze všech oblastí mezilidské komunikace) z objektivnějšího hlediska. 2.2 Problém vymezení pojmu floskule Slovník cizích slov vykládá heslo floskule jako květnaté slovo nebo výraz, fráze bez závažného obsahu, naučená, bezobsažná věta. (SCS, 1966) Vedle toho Slovník spisovného jazyka českého (SSJČ) považuje za floskuli slohově nadnesený, květnatý nebo jen obecně platný, ale neprocítěný, prázdný obrat, výraz, rčení, prů- pověd apod.; fráze, uvádí také, že tento lexém má knižní příznak a je hanlivě citově zabarvený (Havránek, 1960). Z těchto definic je zjevná problematičnost určení floskule. Uvedené vlastnosti, jako je květnatost výrazu, závažnost jeho obsahu, naučenost a neprocítěnost, jsou těžko objektivně měřitelné a málokdy z komunikátu zcela zřejmé. Hlavně ze subjektivní povahy určování přítomnosti těchto rysů u jednotlivých výrazových prostředků plynou problémy ve vymezování pojmu floskule jakožto lingvistického termínu. 2.2.1 Justovo pojetí floskule Ve zmíněném díle (které se stalo inspirací ke vzniku této práce) Vladimír Just definuje floskuli takto: Floskule je at už záměrné, účelové a obmyslné (propaganda, ideologie, reklama, kýč), nebo podvědomé, automatické a mechanické (móda, tren- 3

dovost, snobský slang) zakrývání, zdobení prázdna slovy. A to v rozpětí od pouhé sebe-stylizace a sebe-inscenace až po stylizaci a inscenaci skutečnosti. (...) Slova se floskulemi nerodí, ale vždycky teprve nadužíváním, vyprázdněním, zastíráním a kontextem stávají. (Just, 2009, s. 37) Just rovněž uvádí několik rysů floskulí, o jejichž analýzu se pokusím dále. Z výkladu jednotlivých hesel jeho díla je však zřejmé, že každá floskule nemusí splňovat všechny uvedené podmínky, aby podle autora byla floskulí, zpravidla stačí mít jen jednu z těchto vlastností. 2.2.2 Vlastnosti floskuĺı: květnatost, pozitivní konotace, nezávazná platnost a manipulace s fakty Tento charakter floskule zmiňuje i každá z uvedených slovníkových definic. Jde o květnatost, okřídlenost vyjádření, stoupání si na špičky, jak tento rys nazývá Just. Jeho funkcí je učinit z lexikální jednotky takovou, která by na adresáta působila lepším estetickým dojmem. Tato skutečnost Justovi zjevně obecně nevadí. Naopak je tomu však v případě, že účelem tohoto estetického působení je odvést pozornost k něčemu lepšímu, než je pravým obsahem, zakrýt skutečný význam, jeho podstatu, přibarvit ho či jinak vylepšit. 1 Odváděním pozornosti od pravé povahy skutečnosti jsou výrazné eufemismy. Eufemismus (také meliorativum) je pojmenování nahrazující tabuizovaný či v dané situaci nevhodný výraz, jehož negativně pocit ovaný obsah se snaží zmírnit, eventuálně zastřít záměnou konotací. Manipulace s konotacemi 2 je mimo jiné hojně využívána v oblastech politiky a reklamy (Bachmannová, 2002, s. 130). Některé eufemismy jsou žádoucí, mají funkci, jež by se dala nazvat zdvořilostní (např. odejít na věčnost = zemřít, nevidomý = slepý, zralá dáma = starší žena, prostorově výraznější = tlustý). Pro člověka totiž většinou není jednoduché mluvit přímo o věcech, kterých se bojí, nemá je rád, nebo je považuje za společensky nevhodné v těchto situacích eufemismy volí instinktivně, ulehčují komunikaci jak mluvčímu, tak adresátovi. Eufemismy se v užívání poměrně rychle automatizují, což umožňuje uživatelům jazyka rychlou a jednoznačnou identifikaci významu. Automatizace zde má však ještě jiný efekt: náhradní pojmenování časem převezme negativní konotace původního výrazu a musí být nahrazeno pojmenováním novým, dalším eufemismem (Šebková, 2012, s. 10). (Tento fakt je důvodem toho, proč existuje tolik různých výrazů pro tabuizované činnosti, jako je např. pohlavní styk: vyspat se s někým, mít s někým poměr/vztah, rozdat si to s někým, souložit s někým, smrt: odešel na věčnost, už je mu lépe, není mezi námi, je pod kytičkami/pod drnem, odpočívá v pokoji, odešel do věčných lovišt, poslední rozloučení, či některé fyziologické procesy: odskočit si, jít na záchod/toaletu/wc/sociální zařízení.) Žádoucím rysem eufemismů užívaných zvláště v textech uměleckého stylu je obohacování jazyka a podpora představivosti participanta komunikace (Šebková, 2012, s. 14). Užívání eufemismů může také svědčit o celkově pozitivním životním přístupu 1 Příkladem tohoto jevu v praxi je, užívá-li mluvčí záměrně neznámé odborné termíny či jiné výrazy cizího původu s úmyslem přesvědčit adresáta, aby jeho výrok přijal jako platný, přestože mu nerozumí, protože autorem je pravděpodobně odborník. Dále také zpravidla delší významově prázdné fráze mohou znít inteligentně, informovaně a působit na adresáta týmž dojmem. 2 Konotace je druhotný, asociativní význam slova, významový či stylistický odstín doplňující základní pojmový význam slova (denotaci). 4

mluvčích. Nemusí přitom jít o záměrné zakrývání negativních atributů, ale o důkaz nekritického vnímání reality, pozitivního myšlení lidí, schopnosti (až tendence) vidět i na nepříjemných skutečnostech něco kladného, hledat na všem něco dobrého. Tento charakter eufemizace však považuji za žádoucí, jen pokud koresponduje s pravdivým popisem skutečnosti a zbytečně ji příliš neidealizuje. Vždy ale obecně záleží na úmyslu mluvčího. Lze říci, že eufemismus je v pořádku, jsou-li si jak mluvčí, tak adresát vědomi toho, že se jedná o eufemismus; v opačném případě může sloužit jako prostředek manipulace. Floskule, jak ji chápe Just, lže či zamlčuje pravdu, nekonkretizuje, její význam je příliš neurčitý, zbavuje mluvčího odpovědnosti, je neprůstřelně korektní, anonymní, nicneříkající (zejména tam, kde se na někoho hází vina ) má vyviňující a alibizující moc. (Just, 2009, s. 11) Podle Chloupka (1991, s. 211) v češtině vzrůstá tendence k nepřímému pojmenovávání, jež s eufemizací úzce souvisí. Velmi časté je užívání obrazných pojmenování, zejména metafor (Grepl, 2012, s. 97). Pro současnou češtinu, zvláště pro publicistiku, je metaforičnost typická (tamtéž, s. 104). Oblíbené je užívání výrazů s širokým obecným (a kvůli tomu často zavádějícím) významem za účelem zneurčitění propozice 3. K užívání neurčitého pojmenování někdy dochází z důvodu neinformovanosti mluvčího (Chloupek, 1991, s. 211) (a lenosti informovat se), jindy má však k němu mluvčí jiné motivace, např. vědomě zakrýt či vylepšit pravý význam, manipulovat adresátem. Zdaleka ne všechny eufemismy jsou užívány s poctivým záměrem mluvčího. Vlastnosti umožňující zakrýt nepříjemnou či jinak negativní pravdu (výraz se záporně zabarveným citovým příznakem) a prezentovat ji jako něco pozitivního s připojeným kladným emocionálním příznakem (či pouhé nahrazení citově neutrálním výrazem) se dá totiž velmi jednoduše zneužít. Jazyk se tak stává strategicky používaným nástrojem manipulace (viz např. problematika tzv. politicky korektní mluvy). Užívání eufemismů je záporně hodnoceno, jestliže zakrývá negativní skutečnost abstraktnějším a lépe znějícím jazykovým prostředkem za účelem zkreslení skutečnosti (Lutz, 1990, s. 102). Ze všech uvedených skutečností by mohlo být vyvozeno, že hlavním kritériem rozlišování, zda je výraz zavrženíhodným eufemismem či eufemismem prospěšným, je pravdivost, korespondence jeho významu se skutečností. Je však třeba zdůraznit dle mého názoru kritérium ještě důležitější. Jazyk je jakožto nástroj dorozumívání a myšlení úzce spjat s lidskou povahou, a proto je třeba jej nestudovat odděleně od člověka. Komunikace má zásadní roli při utváření vztahů mezi lidmi. Jestliže chceme být odpovědni za své životy, musíme být odpovědni i za svoji mluvu. Naše myšlenky i slova mají velkou moc a tvoří naši realitu, tak vybírejme obojí s rozumem. (Hay, 2010) Na druhého člověka působí to, jak mu informaci sdělím. Mohu ho potěšit hezkým slovem, urazit či zranit jiným, někdy třeba i pravdivým, ale zbytečně příliš přímo mířeným (či jen neprocítěně vysloveným). Vyřčená slova mají vliv na naši psychiku, proto na nich záleží. Ze zraňujících slov mohou vznikat křivdy, které si nosíme v sobě celý život, ovlivňují naše smýšlení o nás samých, naše rozhodování, chování, postoj k druhým lidem. V jistých situacích je tudíž třeba nevyhýbat se pravdě, ale volit slova citlivě a ohleduplně. K tomu nám může posloužit právě využívání eufemismů. (Prostředkem eufemizace může být i zámlka, tedy to, že si pravdu mluvčí nechá pro sebe, neřekne ji nahlas.) 3 Propozice či také propoziční obsah je to, o čem se pojednává ve výpovědi, obsah výpovědi; stránka významu promluvy, která vymezuje podmínky jejího naplnění. 5

Vrátím se nyní ještě obecně k obsahu floskule. Ten je nepřesně či nesrozumitelně definován, ani v kontextu není jasný (přestože kontext běžně při procesu komunikace dotváří význam lexému, pomáhá adresátovi vybrat ke konkrétní formě z inventáře významů, obsaženém ve slovníku, právě ten zúžený podvýznam, jejž měl autor komunikátu na mysli). Tato nejasnost vzniká procesem rozostření významu až desémantizací (úplným významovým vyprázdněním) právě za účelem vzniku možnosti manipulace s fakty (Just, 2009, s. 18 a 39). Proces postupné ztráty významu je podmíněn dvěma dalšími rysy floskule, které uvádí Just vysokou frekventovaností a zbytečností užití. 2.2.3 Vlastnosti floskuĺı: frekventovanost, naučenost a bezobsažnost Floskule jsou podle Justa nadužívanými, obzvláště zásluhou médií velmi frekventovanými frázemi. To implikuje skutečnost, že je mluvčí jazyka mohou užívat bez větších nároků na přemýšlení. Výhodou je sice rychlé vytváření komunikátu i jeho porozumění, ale současně se z těchto nadužívaných prostředků stávají naučené výrazy či myšlenky (obrazové podklady výrazů), přejímané mechanicky bez jakékoli představivosti. Chybou je podle Justa právě skutečnost, že mluvčí u přejímání nepřemýšlí nad pravým obsahem výrazových prostředků, nevyužívá mozek k originálnímu a individuálnímu kreativnímu myšlení a užívání jazyka. Omezuje tak rozvoj jazykové kultury, tvořivosti mluvčích a živosti jazyka. Svědčí to také o lenosti a ledabylosti mluvčích, o účelovém a neosobním přístupu k jazyku (Just, 2009, s. 18). V Příruční mluvnici češtiny (PMČ) se uvádí, že nadměrné módní užívání některých přejatých slov způsobuje rozvolňování a zamlžování jejich významu (Grepl, 2012, s. 103). Vysoká frekventovanost způsobující automatické přejímání jazykového prostředku tudíž může vést k tomu, že se tento výraz stane bezobsažnou, prázdnou frází, významově opotřebovaným slovním obratem. Ten pak může být mluvčím užit, jak již bylo zmíněno, i jako prostředek manipulace s adresátem. Někteří lingvisté zastávají názor, že k obsahovému vyprazdňování slov dochází také v případě, že je mluvčí užívají bez ohledu na to, zda opravdu vystihují označovanou situaci (Havlík, 2008) (což podporuje fakt souvislosti s bezmyšlenkovitým přejímáním). Vágnost významu není obecně přijímána jako negativní vlastnost, právě naopak, má v jazyce bezesporné výhody (omezený inventář výrazových prostředků je možné užít v potenciálně téměř neomezeném počtu významů, dotvářených textovým i situačním kontextem; k tomu se využívá různá míra obecnosti pojmenování, neurčitá vyjádření). Pokládám tedy za potřebné rozlišit na tomto místě žádoucí významovou vágnost od na první pohled blízkého rysu výše jmenovaného jako bezobsažnost. První z nich se dá charakterizovat jako neurčitost, jakási rozplizlost či roztahovatelnost významu (např. výraz role: role papíru, divadelní role; matička: deminutiva k matka, matice u šroubu; los: zvíře, do loterie; zámek: budova, visací; zář í: podzimní měsíc, svítí; kolo: ozubené kolo, jízdní kolo, kola na vodě, závod na deset kol, volební kolo; práce: pustit se do práce, práce ve stavebnictví, hledat práci, odevzdat dobrou práci, ruční práce, práce motoru (SSČ, 2005, s. 303)). Vágnost je obecnou vlastností slovního významu jeden výraz může mít velké množství rozdílných významů či významových odstínů, může být vztažen k několika různým denotátům 4, v reálném kontextu je však aktuální význam tohoto výrazu plně konkretizován a zjednoznačněn, tudíž již není nejasný a interpretovatelný více způsoby. 4 Denotát je to, co jazykový výraz označuje. 6

Naproti tomu je bezobsažnost jakožto významová vyprázdněnost krajním bodem na pomyslné škále jistoty a přesnosti významu, jedná se o jakousi extrémní vágnost, často je tímto význam bezobsažné fráze velmi zavádějící. Při analýze hesel Justova slovníku floskulí a zamýšlením se nad charakterem a závažností negativ těchto frází jsem si všimla dvojího typu bezobsažnosti. U mnohých z těchto frází bezobsažnost vznikla nadužíváním a mechanickým přejímáním (klišé, módní slova, publicismy 5 ). Obsah jiných obratů je podle autora slovníku však již primárně nereálný, nelogický či zcela nesmyslný (primární bezobsažnost; např. adrenalinové lázně, drtivá většina, sociální zařízení, výherní automat, ujal se role). Tyto prostředky vznikly nejčastěji nepřirozeným či jinak nesystematickým, a tudíž pro mnohé mluvčí dále neprůhledným (zřejmě byl původně prostředkem výrazové aktualizace) přenesením (posunem) původního významu, jedná se o metafory a další obrazná a neurčitá pojmenování. Obsah pojmu je u nich příliš neurčitý, simplifikovaný, zobecněný, tudíž ho pokládám za bezobsažný a významově zavádějící již od počátku své existence v jazyce, ne až díky častému užívání a opotřebování významu (sekundární bezobsažnost; např. zajímavý, v podstatě, smysluplný, na druhou stranu, charisma). 2.2.4 Vlastnosti floskuĺı: bezúčelnost Podle Justa se floskule dále vyznačují zbytečností a bezúčelným užitím, kromě popsaných nežádoucích cílů (vypadat dobře, zakrýt pravou skutečnost, zmanipulovat adresáta) neplní žádnou relevantní jazykovou funkci. Naopak se často jedná o nevkusně a nesmyslně až nevhodně užité pleonasmy 6, které nemají praktický užitek, jsou v daném kontextu otravné (jako příklad Just uvádí užití okřídleného nepřímého pojmenování místo jednoslovného neutrálního slova v časově omezeném vysílání třeba v předpovědi počasí které by mělo být co nejstručnější; např. sněhová nadílka nahradí sníh) (Just, 2009, s. 19 20). Jedná se o květnatá synonyma, tzn. nahrazení obyčejného neutrálního, stylově neaktivního, již automatizovaného funkčního výrazu lépe znějícím synonymním obratem. Proto Just mezi floskule řadí i nezanedbatelné množství módních slov (modernismů), často anglicismů. 2.2.5 Publicistický styl a stylistická funkce floskule Výběr a užití jazykových prostředků při tvorbě komunikátu je ovlivněn cíli a funkcemi dané stylové oblasti, do níž daný komunikát patří. Materiál Velkého slovníku floskulí je čerpán převážně z publicistické stylové sféry. Za nejproduktivnější tvůrce floskulí totiž považuje Just politiky. Z politického diskurzu se dále tyto výrazy dostávají do publicistiky, odkud se šíří do běžného jazykového úzu. Proto se nyní zaměřím nejprve na skutečnosti spojené se stylotvornými faktory, které ovlivňují výběr výrazových prostředků příznačných pro tento styl, a následně na jazykové procesy aktualizace a automatizace vyjadřování, jež jsou pro tento styl typické a v charakteru volených prostředků se nutně odrážejí. Snažím se tak poukázat na možné příčiny vzniku a užívání floskulí a na jejich stylistickou funkci. Je však nutno podotknout, že z důvodu rozsáhlosti této problematiky zde uvádím pouze několik skutečností, které považuji za relevantní vzhledem k tématu mé práce. 5 Publicismus je jazykový prostředek příznačný pro publicistický styl. 6 Pleonasmus = nadbytečné hromadění významově shodných či podobných slov. 7

Z textů publicistického stylu je zjevné jejich těsné sepjetí s dobou, kdy byly vytvořeny (se sociálně-politickou situací dané doby apod.). Proto je především lexikum této stylové oblasti z dlouhodobého (diachronního) hlediska velmi proměnlivé. Avšak vzhledem k určité době vykazují lexikální prostředky jistou stabilitu a slovník vážící se k době a procesům v ní probíhajícím se často opakuje (Chloupek, 1991, s. 206). Ačkoli to vyznívá paradoxně, pro publicistický styl je příznačná modelovost způsobů vyjádření, ale současně i vědomé porušování této modelovosti. Tento paradox souvisí s rozdílnými funkcemi, které texty spadající do této stylové sféry plní na jedné straně informativní, na straně druhé ovlivňovací, přesvědčovací. Potřeba modelového vyjadřování plyne ze snahy o podání rychlé informace, typické je proto užívání automatizovaných jazykových prostředků. Publicistické komunikáty jsou typické užíváním ustálených obratů (přijít na pořad dne, velcí hráči na trhu, zamést pod koberec, vystupovat z pozice síly, palčivá otázka, bouřlivé ovace apod.). Ty jsou totiž způsobem jisté výrazové aktualizace. Rychle se však pravidelným užíváním automatizují i v povědomí adresáta, a ztrácejí tak svou původní stylovou aktivitu, a tedy i schopnost plnit ovlivňovací funkci (Chloupek, 1991, s. 210). Autoři publicistických textů také často užívají zneurčitění propozice 7 (Chloupek, 1991, s. 211), předpokládám, že ze stejných důvodů, jež jsem uvedla v kapitole o významové neurčitosti a bezobsažnosti výrazových prostředků (2.2.3). Studium vyjadřovacích prostředků a úrovně stylizace v publicistickém stylu je důležité, nebot komunikáty tohoto stylu mají velký vliv na jazykové povědomí mluvčích jazyka a i obecně na jejich znalost jazyka, vyjadřovacích prostředků (Srpová, 1998, s. 146). 2.2.6 Aktualizace a automatizace Publicistický styl je styl textů, jejichž účelem je adresáta nejen informovat, ale i přesvědčovat, získávat pro něco. (Čechová, 1996, s. 377) Neméně důležitou funkcí tohoto stylu je pobavit recipienta (Srpová, 1998, s. 146). Z těchto funkcí vychází autoři komunikátů tohoto stylu, když i usilují o aktuálnost, zajímavost, rozmanitost a působivost, a proto užívají příslušných prostředků, např. příležitostných aktualizací, jež připomínají projevy umělecké. (Čechová, 1996, s. 381) Pro publicistické texty je typické napětí mezi aktualizací a automatizací vyjadřování (Chloupek, 1991, s. 205). Aktualizace, způsobená záměrným odchýlením od vyjadřování standardizovaného (Bachmannová, 2002, s. 224), zvýrazňuje osobu autora, především však slouží k ozvláštnění textu a ovlivňování adresáta, udržování jeho pozornosti. Právě za tímto účelem je třeba nahrazovat výrazy již příliš zevšednělé novými, dosud neotřelými prostředky (Grepl, 2012, s. 96). Novináři se tímto způsobem snaží vyhnout nežádoucí šablonovitosti a strnulosti vyjadřování. (Srpová, 1998, s. 148) Nejvydatnějším zdrojem výrazové aktualizace jsou posuny ve významu slov a slovních spojení. Nejčastěji jde o posuny metaforické a metonymické, dále také o užití neologismů (Bachmannová, 2002, s. 224). Automatizace vyjadřování, vznikající častým opakováním určitého výrazového prostředku (nebo i s ním spojeného mentálního konceptu), usnadňuje publicistům 7 Příklady oblíbených neurčitých vyjádření subjektů a objektů v publicistických komunikátech jsou fórum, kruhy, masy, odpovědná místa, odpovědní činitelé, síly, směry, veřejnost, zdroje, živly. 8

sdělování obsahově podobných informací (je totiž nutné, aby rychle podali čerstvé informace) a čtenářům přístup k textu (Bachmannová, 2002, s. 459). Mezi procesy aktualizace a automatizace neexistuje pevná hranice, jeden postupně přechází v druhý a vzájemně se doplňují. Přestože automatizovanost verbálních formulací vyvolává negativní dojem, je zřejmé, že vzhledem k opakovanosti témat a situací může ustálená, modelová forma komunikátu paradoxně posilovat jeho informační hodnotu. (Srpová, 1998, s. 145) Motivací k užití automatizovaného prostředku může být jak atraktivita daného výrazu, tak i neochota či pohodlnost autora vymýšlet nový způsob nominace (pojmenování). Procesem automatizace vznikají taktéž různé frazeologismy, ustálená slovní spojení. Josef Václav Bečka si všiml, že frazeologické obraty vznikají za určitých situací. Formují se tam, kde volný (nevázaný) výběr slov v přímém vztahu k pojmenovávané skutečnosti a v zaměření, jaké autor potřebuje, naráží na obtíže, a je proto nesnadný. Takové obtíže se cítí zvláště silně tehdy, kdy pojmenovávací situace je vcelku běžná a není potřebí vyvíjet úsilí k vytvoření pojmenování aktuálního. V takových případech se přímo nabízí možnost řešit pojmenovávací nesnáze užitím již hotového spojení slov, zejména byl-li takový obrat pro tuto potřebu přímo vytvořen a je pro její vyjádření vhodný. Tím vzniká situace příznivá tomu, aby se takový obrat ustálil a vznikl z něho frazeologismus. (Bečka, 1992, s. 79) Domnívám se, že k podobné automatizaci dochází i při vzniku floskulí, avšak na rozdíl od běžných funkčních frazeologismů k procesu nedochází z důvodu pojmenovávacích obtíží. Podle Marie Čechové jsou floskule automatizované publicistické výrazy, nejedná se o prostředky centrální (ze systémového hlediska). V publicistickém funkčním stylu jsou bezpříznakové, protože nepřitahují pozornost adresáta toto tvrzení však podle ní platí, jen dokud automatizace nepřestoupí určitou mez za tou je vytvořený efekt: frázovité, bezobsažné vyjádření. (Čechová, 2008, s. 36) 2.2.7 Klišé Uvedená definice ukazuje, že Čechová a Just pojímají floskuli rozdílně. Zatímco Čechová ji hodnotí pozitivně jako automatizovaný prostředek s již popsanými funkcemi automatizace (tedy odpovídá termínu stereotyp 8 ), Justovo pojetí floskule je silně negativní. Pro něj je to příliš automatizovaný obrat, tedy ten, který již přestoupil mez zmíněnou v definici Marie Čechové. Justova floskule je blízká pojmu klišé. Navíc však k floskulím řadí velké množství výrazů splňujících výše analyzované rysy, které nejsou všem klišé nutně vlastní. Zdeněk Jemelík píše, že se veřejné mínění z velké části opírá o klišé, jejichž pravdivost se považuje za tak samozřejmou, že se o ní ani nepřemýšlí. Při věcném zkoumání uvedených tvrzení se ukazuje, že bud pro ně chybí důkazy, nebo je dokonce vše úplně jinak. Boj za jejich vyvrácení je však marný: jakmile si je média osvojila, opakují je stále dokola, veřejnost je přijímá a nikdo nechce nic jiného slyšet. Je přece pohodlnější sestavit si svůj obraz světa z klišé než přemýšlet nad argumenty, které je vyvracejí: myšlení bolí. A pokračuje: Jeden ctihodný novinář mi vysvětlil, že stále opakovaná tvrzení, která nikdo nenapadl u soudu, se stávají součástí veřejného 8 Ve stylistice a textové lingvistice v jistých situacích, druzích a částech textu ustálené a frekventované výrazové prostředky, jejichž opakovanost a známost usnadňuje interakci i tvorbu a vnímání textu. Ve stylistickém kontextu se o nich mluví v souvislosti s automatizací. (Bachmannová, 2002, s. 442) 9

prostoru a novináři mají právo zacházet s nimi jako s ověřenými pravdami. Totéž, ale s geniální jednoduchostí vyjádřil dávno před ním válečný zločinec Joseph Goebells: stokrát opakovaná lež stává se pravdou. Mnozí z našich vysoce hodnocených novinářů jsou jeho horlivými učedníky. (Jemelík, 2012) Vedle klišé se v literatuře objevuje také významově podobný pojem fráze jakožto ustálený konverzační výraz chápaný zpravidla jako otřelý a sémanticky téměř prázdný. (Bachmannová, 2002, s. 139) Bečka frázi od floskule i klišé odlišil výrazným rysem neupřímnosti a neprocítěnosti vyjádření. Termín fráze je podle něj hodnotící, nikoli popisný (1943). 2.3 Definice floskule pro tuto práci Jelikož se jednotlivé pokusy o vymezení pojmu floskule v mnohém rozcházejí, je potřeba pro další práci stanovit jasnou definici, umožňující pokud možno co nejjednoznačnější určení floskulí. Rozhodla jsem se přijmout stanovisko Vladimíra Justa a pokládat za floskule všechny výrazy splňující dříve popsané atributy, kterými jsou bezúčelně či nevhodně užitá květnatost, pojmová neurčitost s cílem manipulovat a mechanické užití, související s vysokou frekventovaností a bezobsažností. Hranice mezi žádoucí automatizací a automatizací přehnanou, již u floskulí kritizuje Just, je velmi subjektivní a obtížně určitelná, zvláště z důvodu její proměnlivosti v čase. V této práci se tudíž pokusím s využitím frekvenční analýzy zjistit, jak rychle se mění tato hranice. Přechody mezi aktualizovaným užitím a zcela automatizovaným ustáleným slovním spojením podle mého názoru tvoří škálu (v určitém užití by mělo být možné určit, jak blízko je daný obrat v jistém typu textu v dané době aktualizaci či automatizaci). Frekvenční analýza by mohla také poskytnout odpovědi na otázky, kde se na této pomyslné stupnici aktualizace automatizace nachází floskule a jakou má floskule obecně životnost. 10

3. Praktická část 3.1 Postup výzkumu, použité metody Prvním úkolem bylo určit zkoumaný materiál, tedy vytvořit konkrétní seznam floskulí odpovídajících navržené definici, s nímž bych mohla dále pracovat. Jak píše Just, deset lidí by napsalo deset různých sbírek floskulí a výběr tu bude dán vždy mírou osobního vkusu nebo hudebního sluchu (2009, s. 23). I přes mou snahu definovat floskuli co nejpřesněji zůstává nadále problematika určení floskule velmi subjektivní záležitostí. Závisí totiž na vkusu uživatele jazyka 1, na postoji mluvčího k denotátu (a korelaci postoje s vyzněním vyjádření, pojmenováním, jehož konotace jsou proměnlivé nejen v čase, ale liší se i mezi mluvčími) a na úmyslu mluvčího s adresátem. Toto jsou skutečnosti, které v textu nelze objektivně změřit. Proto i seznam floskulí, které v této práci zkoumám, není zdaleka úplný a nebylo při jeho tvorbě možné se zcela vyhnout jisté diskutabilitě některých položek. Zařadila jsem do něj nakonec pouze hesla z Velkého slovníku floskulí. Abecední seznam floskulí naleznete v příloze A. Jednotlivé floskule se od sebe značně liší nejen formou, ale i dalšími významnými rysy. Abych mohla sledovat a následně generalizovat, jak se chovají různé typy floskulí, jaké tendence ve frekvenci jsou pro které z nich typické, co mají společného a co je naopak vzájemně odlišuje, bylo po výběru floskulí nutné provést jejich klasifikaci. Různé klasifikace uvádím dále v kapitole 3.2. K dosažení cílů popsaných v úvodu práce jsem využívala materiál z textových korpusů. Pokusila jsem se o vytvoření co nejpřesněji formulovaných dotazů v jazyce CQL (Corpus Query Language neboli Korpusový dotazovací jazyk, stručná deskripce následuje v kapitole 3.1.3) pomocí nichž jsem ve vybraných korpusech (uvedených dále v 3.1.2) vyhledávala zvolené floskule. Nakonec jsem provedla frekvenční analýzu dat získaných z korpusového materiálu a pokusila se o interpretaci jejích výsledků, které mi ukázaly nové poznatky o charakteru floskulí a jejich chování z hlediska skutečné užívanosti v současném českém jazyce. 1 Subjektivita je způsobená už jen rozdílností mluvčích (nejen vkusem, estetickým cítěním, percepcí); vkus je ovlivňován mimo jiné tím, co čtou, v jaké oblasti se pohybují, jakými činnostmi se zabývají, co prožili, s jakými lidmi se setkávají a jak tito lidé mluví, jaké konkrétní prostředky v mluvě či psaní užívají; také rozdílnost znalostí a vědomostí tu může hrát roli (čistě teoreticky vše, čemu nerozumí, může být z hlediska recipienta považováno za floskuli, pokud mluvčí nevysvětlí jasně obsah jednotky). 11

3.1.1 Korpus, korpusová lingvistika Při výzkumu jsem vycházela z materiálu textových korpusů. Korpus je rozsáhlá ucelená elektronická databáze počítačově čitelných textů daného jazyka. Je vytvářen primárně pro tvorbu statistických modelů využívaných v oblasti počítačového zpracování přirozeného jazyka a za účelem využívání při lingvistickém bádání, a to v jeho různých odvětvích, jako jsou kupříkladu výzkum a případná komparace řeči různých užších skupin mluvčích (žen, dětí, příslušníků rozdílných sociálních či věkových skupin, obyvatel určitých lokalit, kazatelů, politiků, novinářů apod.), výzkum lexika, gramatiky, syntaxe, sémantiky, pragmatiky, analýza diskurzu, zkoumání v oblastech stylistiky, sociolingvistiky, dialektologie, lexikografie, počítačové lingvistiky i diachronní lingvistiky. Jeho materiál je však využitelný také pro tvůrce jazykových učebnic, překladatele a odborníky v oblasti masové komunikace a médií. Korpusová data se používají i pro výzkum v mnoha dalších nejen humanitních vědách (např. v psychologii, sociologii, pedagogice a v umělé inteligenci). 2 Korpusy umožňují získávat informace o frekvenci jazykových jevů, o jejich typičnosti. Jsou potřebné jakožto velké zdroje dat zvláště pro deskriptivní lingvistiku a kvantitativní popis jazyka. Korpusové texty jsou opatřeny metainformacemi dvojího charakteru informacemi o původu textu (autor, typ textu, žánr, rok vydání či zveřejnění na webových stránkách apod.) a metajazykovými informacemi (základní slovní tvar, gramatické kategorie apod.). Při počítačovém zpracování je potřeba texty nejprve rozdělit na jednotlivé tokeny (pozice, textová slova, neupravené slovní tvary, řetězce znaků ohraničené v textu mezerami či interpunkcí). Ke každému tokenu je následně přiřazeno lemma (základní slovní tvar, tzn. sloveso v infinitivu a jména v nominativu singuláru) a morfologická značka, určující gramatické kategorie daného tokenu (slovní druh, rod, číslo, pád, osoba, čas,... ). Díky anotacím (označkování, doplnění metainformací) se dá i v rozsáhlých korpusech poměrně jednoduše vyhledávat, počítačové zpracování a uložení usnadňuje a urychluje přístup k potřebným datům. Uživatelům zprostředkovávají přehledný přístup korpusové manažery (např. Manatee, uživatelské rozhraní Bonito Rychlý, 2007; Kilgarriff, 2004), počítačové programy, umožňující kromě vyhledávání jazykových dat také jejich třídění, ukládání, zobrazení metainformací, využívání statistických funkcí či vytváření subkorpusů (ČNK, 2013). Značkování korpusů je prováděno bud manuálně, což je ale velice nákladné, nebo automaticky (strojově). To může však zase znamenat zanesení jisté míry nepřesností do značkování. Proto se také mnoho výzkumů v korpusové lingvistice zabývá právě automatickým značkováním textů (Rychlý, 1997). Korpus je zdrojem autentických přirozených dat, obsahuje skutečné věty jazyka, nikoliv jaksi účelově uměle vytvořené vzory, a tudíž je objektivnější pro účely lingvistického výzkumu. Korpusová lingvistika je odvětvím jazykovědy, jehož vznik (v 50. letech 20. století) a následný vývoj byl spjat s rozvojem v oblasti informačních technologií. Mezi první patřily anglické korpusy Brown Corpus, British National Corpus a Bank of English. Autoři jejich vytvořením přispěli k rozšíření nového metodologického přístupu k lingvistickému bádání, vycházejícího z empirismu (oproti 2 V této kapitole vycházím z následujících pramenů, v nichž je možné najít i hlubší informace např. o historii korpusové lingvistiky, tvorbě korpusů, korpusových nástrojích, značkování (anotování) korpusů, současném stavu korpusové lingvistiky v českém prostředí i v zahraničí: McEnery, 1996; Pala, 1996; Pala, 2000; Rychlý, 1997; ČNK, 2013. 12

racionalismu, tedy dosavadnímu jazykovědnému přístupu založeném na introspekci). Přestože se tato metodologie později stala předmětem ostrých kritik (zejména amerického lingvisty Noama Chomského, autora teorie generativní gramatiky), dodnes je považována za velmi přínosnou a pro lingvistický výzkum nepostradatelnou (ideální je však komplementarita obou přístupů, ověřování teoretických hypotéz na reálných datech). Korpusy mohou být různého druhu. Texty jsou v korpusu strukturovány a organizovány se zřetelem k využití pro určitý cíl, vůči němuž pak je korpus považován za reprezentativní. (Rychlý, 1997) Existují korpusy psaného nebo mluveného jazyka, všeobecné či specializované na určitý styl (publicistický nebo odborný), různě velké korpusy. Většina korpusů obsahuje v různém poměru zástupce všech možných kategorií textů. Mohou sestávat i z pouhých holých textů, avšak častěji jsou texty různě anotované za účelem účinnější práce s daty (značkované korpusy poskytují více informací o jazyce). 3.1.2 Vybrané korpusy Pro účely zkoumání vlastností frekvence floskulí považuji za vhodný v první řadě korpus CzechParl, který obsahuje přepsané promluvy z různých zasedání Poslanecké sněmovny i Senátu Parlamentu ČR. Obsahuje 81 874 122 pozic a umožňuje lingvistům výzkum politické mluvy. Korpus je rozdělený do dokumentů podle volebních období, v nichž jednotlivá zasedání proběhla (Jakubíček, 2010). To mi poskytuje možnost srovnávání v čase, díky čemuž je možné sledovat vzestupné či sestupné tendence ve frekvenci floskulí. Dále jsem pracovala se synchronními korpusy 3 psaného českého jazyka SYN2000, SYN2005 a SYN2010, které vznikly v Ústavu Českého národního korpusu (dále ÚČNK) při Filozofické fakultě Univerzity Karlovy v Praze. Všechny tyto korpusy mají velikost 100 milionů pozic, liší se však svým žánrovým rozložením (novější dva korpusy se v žánrovém složení shodují, rozdílnost mezi nimi a korpusem prvním vychází z novějších výzkumů percepce psaného jazyka). SYN2000 obsahuje texty vzniklé v letech 1990 1999, SYN2005 psané komunikáty z let 2000 2004 a SYN2010 z období let 2005 2009. Následující tabulka ukazuje procentuální rozložení jednotlivých žánrů textů obsažených v korpusech. SYN2000 SYN2000 SYN2010 beletrie 15 % 40 % 40 % odborná literatura 25 % 27 % 27 % publicistika 60 % 33 % 33 % Tabulka 3.1: Žánrové rozložení korpusů SYN Korpusy se odlišují také rozložením různě tematicky zaměřených odborných textů (spadajících do rozdílných vědních oborů), dále i velikostí textů pocházejících z publicistických periodik. Je proto potřeba brát tento fakt v úvahu při provádění frekvenční analýzy. Není možné přímé srovnávání frekvencí zjištěných z korpusů SYN2000 se SYN2005 a SYN2010 bez zohlednění těchto rozdílů v jejich rozložení. 3 Synchronní korpus je korpus obsahující texty současného českého jazyka, z časového hlediska zachycuje stav jedné jazykové vrstvy. 13

Floskule jsem vyhledávala také v SYN2006PUB, SYN2009PUB, dalších korpusech vytvořených v ÚČNK. Jedná se o korpusy publicistických textů z let 1989 2004 a 1995 2007. První z nich má velikost 300 milionů pozic, druhý 700 milionů textových slov. Pro všechny korpusy řady SYN platí, že jsou vzájemně disjunktní, tj. každý text může být zařazen pouze do jednoho z nich. Plánovala jsem pracovat taktéž s korpusem FSC2000. Tento korpus vznikl za účelem vytvoření Frekvenčního slovníku češtiny (2004), jehož statistiky obsahuje Velký slovník floskulí. Proto jsem se ho původně rozhodla při své frekvenční analýze využít pro srovnání s daty uvedenými v Justově slovníku. Jelikož se však jedná pouze o upravený materiál korpusu SYN2000, navíc není ani morfologicky označkovaný, je z těchto důvodů pro můj výzkum nevhodný a využívat jej nakonec nebudu. Při vyhledávání jsem využívala i materiál některých webových korpusů 4 czes2, cztenten12 a desam, jež vznikly v Centru zpracování přirozeného jazyka na Fakultě informatiky Masarykovy univerzity v Brně (dále CZPJ). Czes (o velikosti 465 102 710 tokenů) je český korpus obsahující novinové a časopisové články z let 1995 1998 a 2002. Data byla stažena z webové stránky trafika.cz a domovských stránek Lidových novin, Mladé fronty, Českomoravského profitu, Práva a dalších. Některé texty (články a knihy) byly převzaty z mnoha menších webových stránek, jiné pochází z archivů elektronických magazínů. CzTenTen (5 436 289 395 pozic) je nový korpus českých webových textů (vytvořený v roce 2012). Patří do řady korpusů TenTen (Jakubíček, 2013), jejichž předností je především obrovské množství dat, velikost. Stávají se tak vhodnými pro statistické zkoumání jazyka (Suchomel, 2012). Desam (s počtem pozic 1 045 740) je ručně gramaticky a morfologicky označkovaný (desambiguovaný 5 ) korpus. Problémem, který mi však znemožnil detailnější zkoumání frekvenčních posunů floskulí v čase na těchto webových korpusech, je jejich nedostatečná (pokud vůbec nějaká) anotace, co se týče časových údajů o vzniku textů, jež jsou pro výpočty trendovosti naprosto nezbytné. 3.1.3 Vyhledávání pomocí dotazů v CQL V korpusech je možné účinně vyhledávat různé jevy pomocí již zmíněného CQL. Tento dotazovací jazyk vznikl na počátku 90. let 20. století v rámci Corpora and Lexicons Group, IMS na Univerzitě ve Stuttgartu. Jedná se o formální, umělý jazyk, jenž má vysokou expresivní (vyjadřovací) sílu. Využívá regulární výrazy, tedy řetězce znaků (zahrnující různé metaznaky), které popisují celou množinu znaků. Dotaz je tvořen atributy a jejich hodnotami, které se zadávají ve formátu [atribut="hodnota"]. Základními atributy jsou word určitý slovní tvar, lemma základní tvar slova a tag morfologická značka. Kupříkladu pokud chci najít všechny tvary slovesa napsat (napíši, napíšu, napsal, napište,...), zadám do korpusového manažeru dotaz [lemma="napsat"]. Při vytváření dotazů je možné užívat různé operátory: booleovské 6, ale také operátory within (hledá levou část dotazu uvnitř struktury či posloupnosti v pravé části dotazu: 4 korpusy textů volně dostupných na internetu 5 Desambiguace je zjednoznačnění významu. 6 Booleovské operátory jsou logické vyhledávací operátory, pomocí nichž můžeme v řetězci definovat logické vztahy (jako jsou kojunkce logické a a disjunkce logické nebo ) mezi znaky či skupinami znaků (slovy apod.) a tím rozšířit, či zúžit dotaz. 14

[lemma="sedět"] within [lemma="okno"][]+[word="kočka"] within <s/> bude odpovídat např. větám Na okně seděla kočka., Pod oknem zítra bude sedět naše malá mourovaná kočka.), containing (funguje obráceně než within, nalezne strukturu obsahující prvek: <s/> containing [word="nicneříkající"] najde všechny věty obsahující slovo nicneříkající právě v tomto tvaru); kontextové operátory meet a union slouží k vyhledávání dvojic tokenů vyskytujících se v blíže určeném kontextu (např. dotaz (meet [lemma="mít"] [lemma="problém"& tag=".*c4.*"] -5 5) nalezne řetězce jako nemá s tím žádný problém, problémy s matematikou sestra nikdy neměla, máme problém) (více viz Sketch Engine, 2003; Jakubíček, 2010). Dále také můžeme vyhledávat v rámci struktur (vět a dokumentů) či připojit podmínku (např. dotaz 1:[] 2:[] & 1.tag = 2.tag & f(1.tag) > 1 000 vyhledá v daném korpusu všechny dvojice hned za sebou se vyskytujících tokenů, které mají stejnou morfologickou značku, jež je v tomtéž korpuse obsažena více než 1 000krát). Korpusy češtiny nejsou morfologicky značkovány jednotně. V ÚČNK a v CZPJ totiž byly vytvořeny různé systémy anotací, v Praze se používá poziční systém 7 a v Brně systém atributový 8. Jelikož pro svou práci užívám korpusy vzniklé na obou územích, nevyhnula jsem se nutnosti vytvořit dvě sady dotazů. 3.2 Klasifikace floskuĺı V této kapitole uvádím čtyři různé klasifikace floskulí. Rozhodla jsem se materiál systematicky třídit proto, aby byla možná pozdější komparace frekvenčních tendencí jednotlivých typů floskulí, jež se mezi sebou navzájem často značně liší. Nejprve jsem floskule roztřídila podle jejich formy. Tato formální klasifikace mi usnadňovala a zpřehledňovala práci zvláště při tvorbě dotazů v CQL. Seznam vybraných floskulí obsahuje jak jednoslovné výrazy, tak i různá slovní spojení, ale i syntaktické struktury a celé větné celky. Just ve svém slovníku floskulí uvádí i prefixy. Jimi prefigované lexémy považuje za floskule. Kategorie klasifikace floskulí z hlediska formy jsou následující: 1. Jednoslovná (a) Jména substantiva adjektiva kombinace (b) Slovesa 7 U pozičního systému je morfologická značka slovního tvaru tvořena tak, že každá pozice řetězce znaků má svůj stabilní význam. Znak na jejím místě determinuje určitou morfologickou kategorii slova. (Značka je řetězcem 16 znaků, přičemž každá pozice v řetězci odpovídá určité morfologické kategorii.) Konkrétní význam znaků ve značkách: viz Popis morfologických značek poziční systém, 2000. 8 Morfologická značka atributového systému je řetězcem znaků, v němž určitý význam tvoří dohromady dva znaky jdoucí bezprostředně za sebou. První znak každé dvojice je atributem, tzn. udává morfologickou kategorii, druhý znak pak hodnotou. Konkrétní význam znaků ve značkách: viz Sedláček, 2006; další informace o morfologickém analyzátoru Ajka viz např. Sedláček, 2001. 15

v určitém tvaru (verba finita) infinitivy (c) Příslovce (d) Citoslovce 2. Víceslovné fráze (a) jmenné fráze (NP) syntaktická pozice subjektová/objektová syntaktická pozice adverbiále (PP) syntaktická pozice atribut/jmenná část predikátu (b) slovesné fráze (VP) holý přísudek nerozvitý přísudek jmenný se sponou přísudek slovesný jednoduchý rozvitý přísudek složený holý celá věta, podmět + přísudek slovesná vazba (c) číslovky 3. Prefixy 4. Spojky a předložky (syntaktické konstrukce a vazby) Druhou klasifikací je klasifikace tematicko-stylová. Zaměřuje se na to, ve které oblasti lidské činnosti či ve které stylové sféře se floskule vyskytují. Domnívám se, že se v každé oblasti lidské činnosti užívají určité floskule, specifické právě pro tuto oblast (či pro jistý okruh mluvčích, sociální skupinu apod.). Materiál Velkého slovníku floskulí však spadá pouze do následujících kategorií, ostatní obory a oblasti mezilidské komunikace by vyžadovaly komplikovaný sběr dalšího materiálu, jemuž by bylo vhodné věnovat vlastní rozsáhlejší práci, proto se jim v rámci své bakalářské práce dále nevěnuji. Do následující klasifikace jsem přiřadila jednu podkategorii, do níž jistě spadá velké množství floskulí neokomentovaných v Justově slovníku. Jedná se o oblast reklamy, jež velmi úzce souvisí s jazykovou manipulací a persvazivní jazykovou funkcí a k plnění této funkce jsou právě floskule vhodnými výrazovými prostředky (např. Protože vy za to stojíte!). 1. sféra masových médií (publicistický/rétorický styl) politické a ideologické floskule novinářská klišé oblast reklamy 2. slovní vycpávky (stereotypní vsuvky) 3. slang mladistvých (módní slova/obraty) 4. ekologie 5. divadlo Následně jsem floskule roztřídila podle typu bezobsažnosti (viz 2.2.3, podkapitola o bezobsažnosti floskulí). 1. Floskule s primárně nereálným či neurčitým obsahem (jejich obsah je nereálný, nelogický, nesmyslný; vznik přenesením významu; metafory, obraznost; obsah pojmu je příliš neurčitý, simplifikovaný, zobecněný) 16

2. Floskule sekundárně bezobsažné (vznikly nadužíváním a mechanickým přejímáním) klišé módní slova ostatní nadužívané výrazy V poslední klasifikaci třídím floskule podle rysů pro floskule typických, již analyzovaných v teoretické části této práce (viz vlastnosti floskulí: 2.2.1). 1. květnatost (zakrývání a zhezčení), nezávazná platnost, vágnost (obecnost, neurčitost) a manipulace s fakty (anglicismy, termíny, eufemismy, metafory,... ) 2. frekventovanost, naučenost a bezobsažnost (ustálená slovní spojení,... ) 3. bezúčelnost, nelogičnost užití (pleonasmy, nesmysly) Některé klasifikace jsou velice specifické, mírně se z tohoto důvodu odlišují inventářem floskulí od ostatních klasifikací. Jedná se o klasifikaci z hlediska formy, jež zohledňuje právě formální náležitosti floskulí, a proto jsou v ní kupříkladu substantiva oddělena od adjektiv a verb (např. adrenalin a adrenalinový jsou separované jako různé položky). V rámci některých klasifikací dochází k částečnému překrývání některých kategorií (např. u poslední klasifikace, v níž spolu odlišující rysy často úzce souvisí, či jeden přímo vychází z druhého, jak bylo popsáno v 2.2.2, 2.2.3 a 2.2.4), proto je nutno roztřídění floskulí považovat pouze za orientační. Floskule setříděné podle uvedených klasifikací naleznete v příloze C. 3.3 Vyhledávání floskuĺı v korpusech Při vytváření dotazů v CQL jsem řešila problém přesnosti a pokrytí 9 výsledků hledání, tedy zda je pro frekvenční analýzu vhodnější nalézt podmnožinu či nadmnožinu všech hledaných výrazů. Rozhodla jsem se považovat za důležitější kritérium pokrytí s tím, že jsem současně vyřadila z konečného seznamu floskulí ty, které není možné z důvodu přílišné kontextové závislosti postihnout dotazem v CQL (tedy nemají vysokou přesnost). Seznam dotazů (uvedený v příloze B) neobsahuje ty floskule, které jsou v tematickostylové klasifikaci zařazené pouze do oblasti divadla či ekologie (tj. ty, které současně nejsou publicistickými floskulemi, např. výrazy divák, aristotelské/dramatické jednoty, kůrovec). Tyto výrazy totiž v ostatních oblastech komunikace floskulemi nejsou, a jejich vyhledávání by tudíž vyžadovalo příliš mnoho času a dodatečné ruční práce (musela bych procházet každý konkordanční řádek zvlášt 10, přesto by však stále záleželo na mém osobním subjektivním odhadu a určení, které kontextové užití je floskule, a které nikoliv). 9 Přesnost a pokrytí jsou základními metodami měření ve vyhodnocování vyhledávacích strategií. Přesnost (precision) je vyjádřena poměrem relevantních nalezených výsledků a všech nalezených výsledků vyhledávání, udává se zpravidla v procentech. Pokrytí (recall) je poměr relevantních nalezených výsledků a všech správných výsledků (tedy těch, které jsme se vyhledávacím dotazem pokoušeli postihnout); také je udáváno v procentech. 10 Konkordance je obecně shoda určitých sledovaných znaků; konkordanční řádek pak v korpusové lingvistice výsledný řádek odpovídající vyhledávacímu dotazu. 17

3.4 Frekvenční analýza Při vyhodnocování frekvencí floskulí v korpusech bylo nutné zohlednit rozdílnost velikostí jednotlivých korpusů, proto jsem nepracovala s absolutními, ale s relativními četnostmi 11. Pro sledování změn v užívání slov v jazyce existují některé vhodné automatické metody. Při vyhodnocování jsem využívala vybrané statistické metody pro automatickou statistickou analýzu frekvenčních distribucí slov v korpusu, které nedávno navrhl ve své diplomové práci Ondřej Herman (Herman, 2013). Jsou totiž schopné ukázat frekvenční tendence a trendy, tedy to, jestli je tendence ve frekvenci jevu v jednotlivých časových momentech stoupavá či klesavá, nebo se v počtu výskytů o žádnou (relativně pravidelnou) tendenci nejedná. Statistické metody, které využívám, umí do jisté míry odhadnout, zda je frekvence jevu v daném časovém momentu náhodná ( extrémní odlehlá pozorování ), a náhodné body z celkového výpočtu trendovosti vyloučí. Cílem regresní analýzy je postihnout závislost hodnot znaku Y na hodnotách znaku X (Budíková, 1998, s. 38), v našem případě závislost četnosti výskytu floskulí na čase jejich užití. Výsledná regresní přímka značí tendenci v užívání dané floskule. Využívala jsem metodu robustní lineární regrese Theil-Sen, sloužící k odhadování trendů pomocí sklonu regresní přímky. ˆ β ts = med y i y j x i x j, i j Medián (med) je střední hodnota statistického souboru, která dělí řadu vzestupně seřazených prvků souboru na dvě poloviny. Hlavní výhodou tohoto statistického ukazatele je, že není ovlivněn extrémními hodnotami. Dále jsem užívala metodu s názvem Mann-Kendall, která umožňuje ověření statistické významnosti trendu, tzn. jestli (a do jaké míry) jsou výsledky odhadu signifikantní z hlediska statistiky. 12 S = n i=1 j=1 i sgn(x i x j )sgn(y i y j ) Funkce reálné signum (znaménková funkce, značka sgn): pro x > 0 je hodnota v y rovná 1, pro x = 0 y = 0 a pro záporná čísla (x < 0 ) se y rovná -1. Graf této funkce tudíž vypadá následovně: Obrázek 3.1: Graf funkce signum 11 Absolutní četnost: počet výskytů floskulí v korpusu; relativní četnost: poměr počtu floskulí v korpusu a velikosti korpusu (celkového počtu pozic). 12 Podrobnější popis těchto statistických metod: viz Herman, 2013, s. 23 24 a 27 29. 18

Suma (značená řeckým písmenem sigma: Σ) je hromadný součet, součet množiny čísel, i a n jsou indexy označující spodní (i) a horní (n) hranici sumace. Při vyhodnocování mě zajímala tzv. p-value, úroveň statistické signifikance. Jde o standardizovanou hodnotu vypočítanou ze Z, jež získáme výpočtem podle následujícího vzorce: S 1 S > 0 V [S] Z = 0 S = 0 S + 1 S < 0 V [S] Úroveň signifikance je pak definována jako p = 2(1 φ( Z )) 13. 3.4.1 Vyhodnocení Programy vytvořené pro automatické vyhodnocování frekvencí slov v korpusu a trendovosti slov přikládám k této práci na CD. Pomocí souborů s dotazy v CQL a programu eval_query_czpj.sh jsem vyhodnocovala frekvence v korpusech vytvořených v CZPJ, eval_query_ucnk.sh a ucnk.py sloužily k vypočítání frekvencí v korpusech vzniklých v ÚČNK. Ostatní programy mi umožnily získat informace o trendech v užívání slov, tedy hodnoty metod Theil-Sen a Mann-Kendall: SYN eval_syn_trend.sh ucnk_freqdist.py freqs2table_syn.py freqs_add_missing_syn.py CzechParl obojí eval_czechparl_trend.sh freqs2table_czechparl.py freqs_add_missing_czechparl.py ts_mk.py theilsen.py mannkendall.py config.py reader.py 14 Korpusy řady SYN a korpus CzechParl, které jsem používala při vypočítávání trendovosti floskulí, obsahují v anotaci výrazů atributy rok.vyd a day.year, jež poskytují nezbytné informace o časovém momentu, v němž byl daný výraz užit. Díky tomu je možné vyhodnocení pohybů frekvencí v čase. 13 upravená kumulativní distribuční funkce normálního rozdělení 14 Autorem posledních čtyř programů je Ondřej Herman, vznikly v rámci jeho již zmiňované bakalářské práce (Herman, 2013). 19

3.4.2 SYN Nejprve jsem sledovala tendence ve frekvenci u korpusů řady SYN. Výsledky jsou vcelku rozmanité. Z celkového počtu 156 floskulí u 41 prokázaly výpočty vzrůstající trendovost, u 37 floskulí trendovost klesající. Ostatní floskule (jedná se o 78 výrazů, tedy o polovinu zkoumaného materiálu) však žádnou trendovost nemají, bud z důvodu nepravidelnosti změn v užívání, nebo protože jsou v jazykovém systému z frekvenčního hlediska relativně ustálené. Následující tabulky obsahují údaje o trendovosti. Čísla ve druhém sloupci jsou hodnoty vypočítané metodou Theil-Sen, vyjadřují tudíž sklon přímky, jež naznačuje frekvenční tendenci (kladná čísla vzrůstající, záporná čísla klesající, čím vyšší kladné číslo či nižší záporné, tím jsou změny ve frekvenci výraznější). Ve třetím sloupci jsou výsledky testu Mann-Kendall, za hranici statistické významnosti trendu byla zvolena hodnota 0,05. Pokud u dané floskule byla zjištěna vyšší hodnota, trend uvedený v předchozím sloupci neberu v potaz, jelikož tendence jejích četností v korpusech SYN není dostatečně signifikantní (čím je totiž číslo ve třetím sloupci vyšší, tím roste také pravděpodobnost, že je tendence pouze náhodná). Tabulky (celé uvádím v příloze D) jsou seřazeny od floskulí se statisticky nejvýznamnější trendovostí s největším sklonem změn po ty nejméně prokazatelné či s nejmenšími změnami. Ve všech grafech, na nichž dále budu ukazovat výsledky analýzy, jsou hodnotami osy x roky, kdy se floskule v textu vyskytla, na ose y je pak znázorněno, v jaké frekvenci. Jedná se tu o relativní četnost vzhledem k celkové velikosti, kterou v korpusu zabírají texty z daného roku (bylo třeba zohlednit rozdílnost jejich velikostí). Tyto relativní frekvence jsou normalizované na 100 000 000 slov. Floskule se vzrůstajícím trendem (SYN) Tabulku 3.2, obsahující deset floskulí se statisticky nejvýznamněji rostoucím trendem, pro názornost doplňuji ukázkami grafů frekvenčního rozložení několika floskulí vybraných záměrně z různých částí celé tabulky (v příloze D). Prohlédnout si je můžete na obrázcích 3.2, 3.3 a 3.4. Floskule Theil-Sen Mann-Kendall kontaktní gól 0.145303244079 0,0 kreativec 0,126482904168 0,0 zafinancovat 0,0901270890477 0,0 ustojí 0,0735983398814 0,0 casting 0,0586761836906 0,0 napříč spektrem 0,0435025117675 0,0 výherní automaty 0,0381294732583 0,0 hláška 0,0360683780455 0,0 zainvestovat 0,0358878047989 0,0 mega 0,0317456056849 0,0 Tabulka 3.2: Floskule se vzrůstajícím trendem (SYN ) Připojuji taktéž několik korpusových příkladů floskulí kontaktní gól a kreativec, jež mají nejvýrazněji rostoucí trendovost. Věřil jsem, že zápas se dá otočit silou kolektivu. Jenom jsme potřebovali dát v poslední třetině rychlý kontaktní gól. 20

Obrázek 3.2: Frekvenční distribuce floskule kreativec v korpusech SYN. Obrázek 3.3: Frekvenční distribuce floskule projekt v korpusech SYN. Jako by na nás padla deka. Za stavu 1:3 nám chyběl kontaktní gól. Nemyslím, že by nás Rusové tak přehráli, to spíš my sami jsme nehráli dobře. Nedokázali jsme využít kontaktního gólu za stavu 2:1 a ihned inkasovali. Tam byla chyba. Kontaktní gól přišel pozdě. Kdybychom vstřelili Spartě třetí branku a v první třetině jsme na to měli, zabalila by to, mínil urostlý postrach soupeřových hráčů. Bohužel, Pražané vstřelili záhy kontaktní gól, znervózněli jsme, a jak to dopadlo, to všichni víme. Doufáme, že i díky naší práci budou nyní řidiči k chodcům na přechodech tolerantnější a ohleduplnější, míní oba reklamní kreativci. Měl jsem tu člověka, který onehdy vrazil s vozíkem do zdi, protože chtěl tak toužebně mluvit s párkem výkonných kreativců, kteří právě procházeli kolem. Už ten stupidní název výkonný kreativec... Na pavlači za dveřmi grafiků a takzvaných kreativců se hromadily prázdné lahve a stoupal odtamtud kouř z marijánky. No, fakt je, že nemá špatné nápady a že jeho reklamní kampaně sedí. Ani se na ně nemusejí najímat kreativci. 21

Obrázek 3.4: Frekvenční distribuce floskule třešnička na dortu v korpusech SYN. Datart považuji za hodně zdařilou reklamu, pochvalu si zaslouží jak tvořiví kreativci, tak odvážný klient. Dříve byly odpovědi na otázky a řešení konvergentní, dnes si kreativci s posluchačem pohrají a umožní mu zapojit fantazii. Floskule s klesajícím trendem (SYN) Tabulka 3.3 obsahuje floskule, jejichž trendovost v korpusu SYN nejvíce klesá. Na obrázcích 3.5, 3.6 a 3.7 je možné vidět příklady frekvenčních distribucí vybraných výrazů s touto tendencí ve frekvenci. Floskule Theil-Sen Mann-Kendall apod., aj., atd., ad. -0,065549749629 0,0 islámští fundamentalisté -0,0557998075258 0,0 tato země -0,0385097818482 0,0 fundamentalismus -0,0339988062047 0,0 věcnost -0,0260061150262 0,0 deviza -0,0248902753493 0,0 intelektuální -0,0152518825103 0,0 věcný -0,00588189842695 0,0 ztráty na životech -0,0934781184836 0,0001 kádrování -0,038552090859 0,0001 Tabulka 3.3: Floskule s klesajícím trendem (SYN ) 22

Obrázek 3.5: Frekvenční distribuce floskule kádrování v korpusech SYN. Obrázek 3.6: Frekvenční distribuce floskule A vy to dobře víte! v korpusech SYN. Obrázek 3.7: Frekvenční distribuce floskule údajně v korpusech SYN. 23

Floskule s nulovou trendovostí (SYN) Následuje tabulka 3.4 s ukázkami floskulí, u nichž nebyla prokázána žádná tendence v trendovosti. Z obrázků 3.8, 3.9 a 3.10 je zřejmé, proč tomu tak je. Floskule Theil-Sen Mann-Kendall lisabonská smlouva 0,0 0,0054 není jasné 0,0 0,0065 mít problém 0,0 0,0139 mráz po zádech 0,0 0,026 heled te se 0,0 0,034 revize výsledků druhé světové války 0,0 0,0345 booklet / buklet 0,0124777581705 0,0635 signál -0,00291025936563 0,0689 transparentní 0,00679781365046 0,0802 Je vymalováno! A je vymalováno! 0,0 0,0844 Tabulka 3.4: Floskule s nulovou trendovostí (SYN ) Obrázek 3.8: Frekvenční distribuce floskule národní zájmy v korpusech SYN. Obrázek 3.9: Frekvenční distribuce floskule neviditelná ruka trhu v korpusech SYN. 24

Obrázek 3.10: Frekvenční distribuce floskule chaot v korpusech SYN. 3.4.3 CzechParl Jak jsem již psala dříve, Just se ve svém slovníku floskulí zaměřil právě na politické a ideologické floskule, proto se nyní zaměřím na vyhodnocení trendovosti floskulí v korpusu CzechParl, který se díky svému materiálu (viz 3.1.2) hodí pro výzkum řeči politiků. Výsledky jsou následující: Téměř 72 % všech floskulí nemá v rámci tohoto korpusu žádnou tendenci ve frekvenčních změnách. U 25 % floskulí byla zjištěna vzrůstající trendovost, u pouhých 3 % trendovost klesající. Floskule se vzrůstajícím trendem (CzechParl) Deset floskulí s největší pravidelností ve vzrůstů užívanosti uvádím v tabulce 3.5. Opět ji doplňuji grafy na obrázcích (3.11, 3.12, 3.13). Floskule Theil-Sen Mann-Kendall vydiskutovat 0,0610029169067 0,0 napříč spektrem 0,0385481986006 0,0 pojd me 0,0239047226885 0,0 z mého pohledu 0,0225222596866 0,0 transparentní 0,0184802736321 0,0 na půdě 0,0125033141157 0,0 mít problém 0,00778084428228 0,0 navýšení 0,00724635910091 0,0 zajímavý 0,00502220267515 0,0 férové/fér 0,01247861779 0,0001 Tabulka 3.5: Floskule se vzrůstajícím trendem (CzechParl) 25

Obrázek 3.11: Frekvenční distribuce floskule napříč spektrem v korpusu Czech- Parl. Obrázek 3.12: Frekvenční distribuce floskule Česko v korpusu CzechParl. Obrázek 3.13: Frekvenční distribuce floskule na půdě (Senátu,...) v korpusu CzechParl. 26

Floskule s klesajícím trendem (CzechParl) Tabulka 3.6 obsahuje všechny floskule nalezené v korpusu CzechParl, jejichž užívanost má klesající tendenci (viz graf na obrázku 3.14). Floskule Theil-Sen Mann-Kendall deviza -0,0581918252938 0,0014 nezastupitelný -0,00905138305172 0,01 přední -0,00808346424152 0,0124 nelze nevidět (modalita) -0,0135961144821 0,028 věcný -0,0023949125943 0,0339 Tabulka 3.6: Floskule s klesajícím trendem (CzechParl) Obrázek 3.14: Frekvenční distribuce floskule deviza v korpusu CzechParl. Floskule s nulovou trendovostí (CzechParl) Následuje tabulka 3.7 ukazující některé floskule s nepravidelnou frekventovaností v užívání. Příklady grafů naleznete na obrázcích 3.15, 3.16 a 3.17. Floskule Theil-Sen Mann-Kendall lisabonská smlouva 0,0 0,0028 briefing/brífink 0,0 0,0073 sexy 0,0 0,0216 běh na dlouhou trat 0,0 0,0407 třešnička na dortu 0,0 0,0455 image/imidž -0,0142149642365 0,0527 nelze nevidět -0,043969824846 0,055 intelektuální -0,0177274064774 0,0579 horizont 0,00395361986166 0,0582 konsenzus/konsenz -0,0280798986092 0,0616 Tabulka 3.7: Floskule s nulovou trendovostí (CzechParl) 27

Obrázek 3.15: Frekvenční distribuce floskule běh na dlouhou trat v korpusu CzechParl. Obrázek 3.16: Frekvenční distribuce floskule kočkopes v korpusu CzechParl. Obrázek 3.17: Frekvenční distribuce floskule tato země v korpusu CzechParl. 28

3.4.4 Komparace Shodné tendence byly potvrzeny pouze u 20 floskulí. Z nich čtyři mají v obou korpusech klesající trendovost, ostatní stoupající. U 62 dalších floskulí nebyly ani na jednom korpusu nalezeny frekvenční tendence. U osmi floskulí si zjištěné trendy odporovaly, ve všech případech v korpusech SYN trendovost postupem času klesá a v CzechParlu naopak stoupá. Informace u zbývajících 66 floskulí se v rámci těchto korpusů liší většinou jen nepatrně: u jednoho relativně pravidelná tendence prokázána nebyla, u druhého ano. U 25 v SYN ech klesá, 25 stoupá, u 15 stoupá v CzechParlu a jedné klesá. O jaké konkrétní floskule se jedná, se můžete dozvědět z poslední tabulky v příloze D. Pro ilustraci tu přidávám i grafické srovnání některých floskulí (3.18, 3.19, 3.20, 3.21, 3.22, 3.23, 3.24, 3.25). Rozdíly mezi výsledky trendovosti v těchto korpusech nejsou zanedbatelné. Je třeba vzít v potaz skutečnost, že SYN (vzniklý spojením veškerých dostupných synchronních korpusů vytvořených v ÚČNK) je značně rozsáhlejším korpusem než CzechParl. Je tudíž mnohem pravděpodobnější, že se v něm trendovost projeví výrazněji, obsahuje totiž více dat, jimiž může výskyty určitých výrazů podložit. Odlišnost trendovosti floskulí může tedy být způsobená bud nedostatkem dat obsažených v CzechParlu, nebo také rozdílností materiálu obou korpusů. Dalo by se vyvodit, že např. floskule A vy to dobře víte! (a další tohoto typu, tedy všechny uvedené, u nichž byla zjištěna tendence v trendovosti, ale lišila se mezi oběma korpusy) je v politické mluvě čím dál tím častěji používaná, zatímco v komunikaci běžných uživatelů jazyka proběhl proces opačný: dříve byl trend užívat této floskule, ten však postupem času upadá. Ve výsledných tabulkách (viz přílohu D) s údaji o trendovosti floskulí v SYNu je možno pozorovat, že nárůst výskytů se týká především anglicismů (např. casting, sexy), ale také kupříkladu oblíbených výrazů současné mládeže (pařit, fakt dobrý, hláška, mega). Vedle toho dřívější vysokou frekventovanost a postupný (v některých případech však i vcelku náhlý) pokles ve frekventovanosti výskytů zaznamenaly floskule týkající se minulého politického režimu, případně i aktuální politické situace (kádrovat, kádrování, landsmanšaft, ztráta suverenity, islámští fundamentalisté). Nepravidelné změny ve frekvencích byly zjištěny např. u spojení lisabonská smlouva, tj. u výrazů, které měly v jistém období patrný nárůst četností výskytů, avšak časem se staly neaktuálními. Dále také u takových floskulí, které jsou užívány stále s přibližně stejnou ustálenou frekvencí (holokaust). U floskulí typu kádrovat/kádrování, které měly v korpusu SYN klesající trendovost, v CzechParlu ke změnám v trendovosti nedochází, v politické mluvě jsou stále srovnatelně užívané. Obrázek 3.18: Frekvenční distribuce floskule drtivá většina v korpusech SYN. Obrázek 3.19: Frekvenční distribuce floskule drtivá většina v korpusu CzechParl. 29

Obrázek 3.20: Frekvenční distribuce floskule Obrázek 3.21: Frekvenční distribuce floskule nezastupitelný v korpusech SYN. nezastupitelný v korpusu CzechParl. Obrázek 3.22: Frekvenční distribuce floskule nicméně v korpusech SYN. Obrázek 3.23: Frekvenční distribuce floskule nicméně v korpusu CzechParl. Obrázek 3.24: Frekvenční distribuce floskule v pohodě v korpusech SYN. Obrázek 3.25: Frekvenční distribuce floskule v pohodě v korpusu CzechParl. 30