Gramatika a korpus 2012: 4. mezinárodní konference Grammar and Corpora 2012: 4 th International Conference U příležitosti stého výročí narození Miloše Dokulila On the occasion of Miloš Dokulil s 100 th birthday 28. 30. listopadu 2012 November 28 30, 2012 sídlo Akademie věd České republiky, Národní 3, Praha the headquarters of the Czech Academy of Sciences, Národní 3, Prague Abstrakty / Abstracts
2 Korpus velkých písmen Martin Beneš benes@ujc.cas.cz Příspěvek představí způsob anotování a naznačí možnosti využití korpusu velkých písmen, postupně budovaného v rámci grantového úkolu Psaní velkých písmen v češtině v oddělení jazykové kultury ÚJČ AV ČR. Materiálovou bázi tohoto korpusu tvoří výrazy, které byly manuálně excerpovány z e-mailové korespondence jazykové poradny s tazateli v letech 2006 2009 a z telefonických dotazů a v souvislosti s nimiž tazatelé kladli otázky, zda a (příp.) na kterých místech v nich psát velká písmena (VP). Jelikož původní databázi není možné strukturovaně prohledávat, bylo rozhodnuto pořídit její elektronickou anotovanou verzi zmíněný korpus velkých písmen. Na základě teoretických úvah nad funkcemi VP v českém pravopise, nad definičními rysy proprií, nad pravidly o psaní VP (vyplývajícími ať už přímo, či nepřímo z PČP) byl vypracován specifický způsob popisu distribuce VP v češtině. V konkrétním (nejasném) případě je třeba pro správné napsání VP řešit dvě otázky nejprve tzv. sémantickou (je daný výraz proprium?), pokud je odpověď kladná (a je-li proprium víceslovné), pak i tzv. otázku strukturní (jaká část propria je tzv. druhová a jaká tzv. propriální, tj. v jakých jeho částech psát VP?). Z těchto otázek, jež reprezentují mimojazykové informace, jejichž potřebnost se v souvislosti s psaním VP opakovaně zdůrazňuje, vyplývá způsob anotování původní prosté databáze. Každému řetězci, který byl jakožto předmět dotazu směřovaného jazykové poradně do databáze zařazen, je v první řadě přidělena informace o tom, zda jde, nebo nejde o proprium (což následně umožní získat např. přehled o apelativech, která mají mluvčí tendenci psát s VP). U každého propria (zásadní je to zejména u proprií víceslovných) je dále rozlišena jeho tzv. druhová složka (reprezentující v jeho celku druh pojmenovávané skutečnosti) a jeho tzv. samotná propriální složka (název, který je konkrétnímu exempláři dané třídy jevů označovaných výrazem pro druhovou složku aktuálně přidělen). U každé části (důležité je to opět v případě částí víceslovných) je určeno pořadí v lineárním řetězci jejích jednoduchých složkových výrazů a zaznamenáváno, zda se v ní má psát VP, nebo MP a zda tato konkrétní pozice ne/byla předmětem tazatelova dotazu. Tak např. v propriu Sídliště Generála Píky budou jednotlivým složkám přiřazeny následující charakteristiky: Sídliště, druhová složka (srov. sídliště Máj, řeka Labe), 1. výraz, předmět dotazu, VP; Generála, propriální složka, 1. výraz, Gen, VP; Píky, propriální složka, 2. výraz, Gen, VP. V takto anotovaném korpusu bude možné zadávat dotazy typu: Najdi všechna propria, v jejichž druhové složce se u prvního výrazu píše MP a jejichž propriální složka je v genitivu. Cílem korpusu není primárně získávat kvantitativní charakteristiky, ale zjistit, jaké strukturní typy proprií se vymykají explicitním nebo implicitním pravidlům o psaní VP v češtině (jako náš příklad se sídlištěm drtivá většina druhových složek se píše s MP); a u nich pak příp. navrhnout/doporučit změnu kodifikace (budou-li se zdát neodůvodněné), nebo je v co nejúplnější míře zaznamenat (budou-li se zdát odůvodněné nebo dobře motivované). Funkcionální vidové dvojice v Českém národním korpusu Tilman Berger tberger@uni-tuebingen.de Mezi nejspornější témata slovanské aspektologie patří otázka, jestli dokonavé protějšky nedokonavých sloves můžou být vytvořeny prefixací. V české jazykovědě byla většinou
3 formulována v té formě, jestli existují prostě vidové prefixy (což však není úplně totéž), a odpověď na ni bývá záporná (viz např. Komárek 1984). V rusistice je však představa, že existují funkcionální vidové dvojice, tj. takové dvojice jednoduchého a prefigovaného slovesa, které v textu fungují jako vidové ekvivalenty, i když prefix má svůj vlastní význam, čím dál tím populárnější. Velká objem Českého národního korpusu nám umožňuje hledat věty, v nichž vystupují oba členy vidové dvojice, srov. např.: (1) Byl možná jediný, kdo cítil, že Mike dělá, co udělat musí. (2) Situace, jež není vysloveně drastická, se dá řešit a vyřešit. Chci ukázat, jak nám takové doklady pomáhají posoudit, které dvojice jsou funkcionálně ekvivalentní a které nikoliv. Dále chci diskutovat několik sporných případů, kde zdánlivě existuje více než dva ekvivalenty (např. vítat přivítat/uvítat, mlít umlít/semlít). Literatura: Komárek, M. 1984. Prefixace a slovesný vid (K prefixům prostě vidovým a subsumpci. Slovo a slovesnost 45, 257 267. Lehmann, V. 1993. Die russischen Aspekte als gestufte Kategorien. Die Welt der Slaven 38, 265-297. Van Schooneveld, C. H. 1958. The so-called. In: Dutch Contributions to the Fourth International Congress of Slavicists. s -Gravenhage. 159-161. Zaliznjak, A. A., Šmelev, A. D. 1997. Lekcii po russkoj aspektologii. München. Pseudodeminutiva v češtině Jana Bílková jana.bilkova@uhk.cz Deminuce je jednou ze základních modifikačních onomasiologických kategorií. Z hlediska strukturního jsou deminutiva definována jako substantiva, která vznikla modifikací významu základových substantiv příznakem deminuce (zdrobnění). Význam deminutiva je dán významem základového substantiva a deminutivního sufixu. Vícestupňový systém deminutiv v češtině, charakteristický složitými formálněsémantickými vztahy, je dále komplikován na jedné straně existencí slov, která jsou po formální stránce deminutivy, ale jejichž význam není primárně deminutivní (deminutivní příznak je u nich oslaben), tedy existencí formálních deminutiv se sekundárním, lexikalizovaným, často specifikačním významem popílek, večírek, sloupek, kočárek, hubička, čárka, kolečko, na druhé straně také existencí slov, která mají jistý deminutivní významový příznak (kvantitativní či emocionální), z formálního hlediska však do souboru deminutiv nepatří. Příspěvek si všímá právě takových slov, která mají deminutivní příznak, ale nevznikla deminutivní modifikací základového substantiva, tj. která byla odvozena od nesubstantivních základů (event. u kterých základové slovo chybí). Jedná se o deverbativa a deadjektiva, a to především o a) jména nositelů vlastnosti (ufňukánek, neviňátko), b) jména předmětů a prostředků činnosti (zrcátko, louskáček), c) jména botanická a zoologická (moudivláček, silenka). Deminutivní příznak takových slov ( pseudodeminutiv ) je důsledkem jednak
4 sufixální homonymie (jsou derivována sufixy, které jsou se sufixy deminutivními homonymní), jednak paralelní derivace (jejich deminutivní příznak vzniká na pozadí paralelně utvářených substantiv, u nichž se deminuce nepociťuje např. zrcátko - zrcadlo; rozcuchánek - rozcuchanec). Příspěvek vychází z dat získaných prostřednictvím Českého národního korpusu SYN. Kompozice a její potenciál v současné slovní zásobě češtiny Ivana Bozděchová Ivana.Bozdechova@seznam.cz Jako druhý hlavní způsob tvoření slov v češtině má kompozice tradičně zastoupení především u některých typů pojmenování, mezi nimi zejména odborných (termínů, příp. dalších profesionálních a speciálních názvů). Podíl kompozičního tvoření (různých typů) však narůstá také v lexiku současných textů publicistických a běžně mluvených. Příspěvek se pokouší ilustrovat využití slovotvorné kompozice u vybraných typů pojmenování osob (jmen činitelských, konatelských a nositelů vlastnosti), a to na základě konfrontace lexikografického zaznamenání těchto názvů ve výkladových slovnících češtiny (počínaje Slovníkem spisovného jazyka českého), slovnících neologismů a cizích slov s výskytem v textech Českého národního korpusu. Korpusové materiály umožní posoudit nejen produktivitu těchto kompozit, ale také jejich funkčnost a stylovou platnost. Odlučitelná předpona preč a prefix wot- ve starší hornolužické srbštině a jejich role při gramatikalizaci slovesného vidu Katja Brankačkec katja.brankackec@gmx.de Odlučitelná předpona preč a prefix wot- ve starší hornolužické srbštině a jejich role při gramatikalizaci slovesného vidu V sorabistické literatuře najdeme opakovaně tezi o zvláštní roli tzv. odlučitelných předpon (v germanistické literatuře označených jako verb particles resp. Verbpartikeln) při vzniku vidových párů: slovesné odvozeniny s těmito předponami, vzniklé pod vlivem německých sloves s odlučitelnou předponou, mohou dle této teze být imperfektivním partnerem perfektivních sloves s prefixem stejného významu, např. won hić wuńć (doslovně: jít ven vyjít), srov. Michalk 1959, Brijnen 2000, Toops 2001a a 2001b, Scholze 2007. Příspěvek zkoumá využití předpony wot- a odlučitelné předpony preč ve starší hornolužické srbštině. Na základě korpusu starší hornolužické srbštiny ukážeme, že zdánlivá synonyma mají ve starší lužické srbštině spíše odlišný význam. Jediné možné vidové páry typu preč hić (ip) woteńć (p) jsou takové odvozeniny, v nichž mají prefix a odlučitelná předpona směrový (direkcionální) význam. Doklady s takovými slovesy nalezené v korpusu však nepodporují tezi o vzniku vidových párů, v nichž by sloveso s odlučitelnou předponou fungovalo jako imperfektivní partner. Doklady naopak podporují tezi, že slovesa pohybu s prefixem wot- jsou spíše vidově neutrální, popř. obouvidové. Volba mezi prefixem wot- a odlučitelnou předponou preč je pravděpodobně nejvíce ovlivněna kontaktním jazykem (němčinou) a významem odpovídajících sloves, respektive předpon v něm.
5 Literatura: Brijnen 2000: German Influence on Sorbian Aspect: The Function of Directional Adverbs, In: Gilberts, Dickey et al (Hrsg.): Languages in contact. (Studies in Slavic and General Linguistics, 28), Rodopi, Amsterdam, Atlanta, 67 71 Michalk 1959: Über den Aspekt in der obersorbischen Volkssprache, In: Zeitschrift für Slawistik 4, 241 253 Scholze 2007: Das grammatische System der obersorbischen Umgangssprache, Konstanzer Online-Publikations-System (KOPS), http://nbn-resolving.de/urn:nbn:de:bsz:352-opus-32217 Toops 2001a: Aspectual Competition and Iterative Contexts in Contemporary Upper Sorbian, In: Journal of Slavic Linguistics 9/1, 127 154 Toops 2001b: The Grammar of Paraphrastic Imperfectives in Latvian and Upper Sorbian, In: Slavic and East European Journal Vol. 45, No 1, 96 114 Člověk v množném čísle (v historické i v současné češtině) Alena M. Černá alenacerna@ujc.cas.cz Příspěvek pojednává o konkurenci paradigmatických a supletivních plurálových (včetně staročeských duálových) tvarů lexému člověk ve starší i v současné češtině. Za výchozí jsou pro starou češtinu pokládány tvary nom. duálu člověky a nom. plurálu člověci, člověkové, ľudie, u nichž dochází k posunům formálním (záměny původních o-kmenových tvarů za tvary jiných kmenů; změny hláskoslovné), gramaticko-funkčním (oboustranné záměny plurálových a duálových tvarů) i sémantickým. Příspěvek se zabývá vývojem této konkurence v češtině doby střední a současné. Dnešní stav ukazuje, že ve funkci plurálových tvarů je v (nespisovné) češtině užíváno vedle tvarů lidé/lidi též tvarů člověci/člověkové, tedy tvarů z historického hlediska náležitých, avšak v současném jazyce silně příznakových. Cílem je mj. definovat řečové situace, v nichž je upřednostněn příznakový tvar paradigmatický před tvarem supletivním. Materiálovou bázi příspěvku tvoří korpus současné češtiny a veřejné i neveřejné korpusy a textové banky historické češtiny, dále internet a pro historickou češtinu i další zdroje (zejména historické gramatiky a slovníky). Součástí příspěvku jsou citace dokladů, jež jsou pro objasnění formálního i sémantického charakteru lexému nezbytné. Nástroj pro slovotvornou analýzu jazykového korpusu Václav Cvrček, Pavel Vondřička vaclav.cvrcek@ff.cuni.cz, Pavel.Vondricka@ff.cuni.cz Česká slovotvorba udělala především zásluhou zakladatelského počinu M. Dokulila velký pokrok v oblasti teorie tvoření slov. Menší pozornost byla (i s ohledem na někdejší nedostupnost dat a nástrojů) věnována kvantitativní stránce fenoménů zahrnovaných do této oblasti lingvistického bádání. Moderní jazykové korpusy přitom svým rozsahem i zpracováním přímo vybízejí k aplikaci teoretických poznatků a k popisu konkrétních oblastí v jejich relativní úplnosti. Jde přitom zejména o tato témata: formální vymezení slovotvorných
6 paradigmat, zkoumání jejich rozsahu a inventáře, určení centra/periférie a otázky produktivity jednotlivých způsobů tvoření. Nástroj, který hodláme v tomto příspěvku představit a který vznikl na materiálové základně korpusů ČNK, si klade za cíl usnadnit korpusově založené bádání v těchto oblastech. Aplikace není schopna automaticky hledat slovotvorné vztahy mezi jednotkami v korpusu, slouží ale k testování hypotéz o slovotvorných vztazích mezi různě specifikovanými vzory/dotazy. Uživatel aplikaci zadává na vstupu pomocí regulárních výrazů základní charakteristiku společné báze a odlišujících formantů (prefixů, sufixů apod.) dvojice (příp. trojice) slovotvorných vzorů. Na rozdíl od běžného korpusového vyhledávače tato aplikace výsledky dotazů mezi sebou porovnává a zjišťuje, zda se odlišují pouze ve specifikovaném formantu a shodují pouze ve specifikované bázi. Výsledkem je inventář všech nalezených tvarů či lemmat odpovídajících zadaným vzorům, a především jejich průnik - inventář tvarů se společným základem (a odlišným formantem) nalezeným v obou dvou (či více) vzorech, tedy tvarů účastnících se zadaného slovotvorného modelu, a mnoho dalších kvantitativních informací. Badatel může v rámci dotazu také specifikovat hláskové alternace, které se při odvozování můžou aplikovat, a určuje základní gramatické charakteristiky slova fundujícího a fundovaného (nejčastěji slovní druh). Aplikace pracuje v prostředí webového prohlížeče (tedy bez nutnosti instalace), nabízí možnost snadného odkazování na zadání kteréhokoli pokusu, což ulehčuje sdílení poznatků a snadné citování, a poskytuje uživateli rozsáhlou nápovědu a manuál ke snadnému použití. Na základě užívání tohoto nástroje, jehož oficiální zveřejnění se připravuje na listopad 2012, je možné zformulovat některé základní principy korpusově založené slovotvorby, které vyplývají z důrazu na sémaziologický a kvantitativní pohled na tvoření slov. Negace a skopus kvantifikátorů Mojmír Dočekal, Hana Strachoňová docekal@phil.muni.cz, 110155@mail.muni.cz Věty přirozeného jazyka, ve kterých se vyskytuje negace a nějaké další kvantifikační výrazy, jsou alespoň principiálně víceznačné. Proto věta jako (1) má dvě možné interpretace (Hajičová (1975) rozlišuje mezi negací slabou a silnou, případně externí a interní), první tvrdí o všech námořnících, že měli tu vlastnost, že nebyli opilí (interní negace), druhá tvrdí, že není pravda, že všichni námořníci byli opilí. První interpretace je pravdivá jen v případě, že ani jeden námořník nebyl opilý, druhá v případě, že část námořníků byla opilá a část ne. V predikátové logice lze tento rozdíl zachytit jako rozdíl v dosahu negace: bud má negace dosah jen přes predikát (interní negace) (1-a), nebo je v jejím dosahu celá formule (externí negace) (1-b). To, že podobné věty přirozeného jazyka jsou víceznačné, je dobře známo, viz Jackendoff (1972) pro angličtinu, Hajičová (1991, 1975) pro češtinu a Büring (1997) pro němčinu. Všechny uvedené práce se navíc shodnou v tom, že to, která z obou interpretací je v daném přirozeném jazyce primární, je dáno především aktuálním členěním (např. česká věta (1) vykazuje silnou tendenci k tomu být interpretována jako (1-b)). Nicméně, pokud je nám známo, neexistuje zatím žádná studie, která by preference obou čtení v daném přirozeném jazyce zkoumala v korpusu (jediná výjimka pro angličtinu je Hoeksema (1999)). Proto bychom se chtěli (za prvé) věnovat právě tomuto problému. V korpusu SYN2005 lze najít jak doklady vět jasně interpretovaných s interním dosahem negace, viz (2-a), tak vět interpretovaných jasně s externím dosahem negace, viz (2-b).
7 Úkolem našeho příspěvku je na základě korpusu zjistit, které z obou čtení je v češtině preferované. Kromě aktuálního členění je totiž nutné zohlednit další lingvistický faktor čeština má pro interní negaci gramatikalizovaný prostředek negativní zájmena doprovázená negativní shodou na slovese. Negativní zájmena by tedy podle klasického Paniniho blokačního principu (viz Horn (1989), Kiparsky (1973) a mnozí další) měla blokovat možnost interpretace sekvence všechno ne s interním dosahem negace, protože přesně tento význam je vyjádřitelný pomocí negativních zájmen (to je zřejmě hlavní důvod silné preference pro externí negační interpretaci věty (1)). Nicméně proti blokačnímu principu stojí aktuální členění, kde je podle Hajičové česká negace bezpříznakově interpretována tak, že subjekt je presuponován, tzn. interpretace negace je interní. Náš příspěvek se tedy pokusí ukázat (do té míry, do jaké lze na základě korpusových dat soudit), zda je pro českou negaci důležitější blokační princip, nebo aktuální členění. (1) Všichni námořníci nebyli opilí. a. x[ n a mo r n i k ( x) o p il y ( x)] b. (2) x[ n a m o r ni k ( x) o p il y ( x)] a. a jak jsem ji kladla opatrně, aby nespadla a všechna ta jména se nevysypala b. ozvalo se zaklepání na dveře. Tak přece se na něj všichni nevykašlali! Reference: Büring, Daniel. 1997. The great scope inversion conspiracy. Linguistics & Philosophy 20:175 194. Hajičová, Eva. 1975. Negace a presupozice ve významové stavbě věty. Praha: Academia. Hajičová, Eva. 1991. Jsou záporné věty víceznačné? Slovo a slovesnost 52:280 284. Hoeksema, Jack. 1999. Blocking effects and polarity sensitivity. In JFAK: Essays dedicated to Johan van Benthem on the occasion of his 50th birthday, ed. Maarten de Rijke & Yde Venema Jelle Gerbrandy, Maarten Marx. Horn, Laurence R. 1989. A natural history of negation. Chicago: Unversity of Chicago Press. Jackendoff, Ray S. 1972. Semantic interpretation in generative grammar. Cambridge, Ma: MIT Press. Kiparsky, Paul. 1973. Elsewhere in phonology. In A Festschrift for Morris Halle, ed. Paul Kiparsky & Steven Anderson. New York: Holt, Rinehart and Winston. A corpus-based study of gender assignment in recent English loanwords Thomas Egan, Gudrun Rawoens Thomas.Egan@hihm.no, Gudrun.Rawoens@UGent.be This paper examines the gender of recently borrowed English nouns in Norwegian. Gender assignment is part of the morphological integration of borrowed nouns, and although English loanword gender has been dealt with in previous studies (e.g. Graedler 1998; Johansson &
8 Graedler 2002), it is only during the past decade that large corpora of Norwegian have been made accessible for research, and thus enable comprehensive analyses of loanwords based on large corpora of written and spoken [ language] in formal and informal settings from a variety of media (Onysko 2007: 98). Grammars of Norwegian often view gender as a random lexical feature which is for the main part completely unpredictable (e.g. Næss 2011: 126). On the other hand, several recent studies take a principled view of gender assignment as rule-based or dependent on inherent schemas (e.g. Trosterud 2001; Enger 2001; 2009; Halse 2004; Kristoffersen & Simonsen 2009). The gender assignment of loanwords may be regarded as natural test cases for hypotheses about productive gender and synchronous assignment rules, and thus contribute valuable information to the study of gender assignment principles in general, as well as with respect to loanwords in particular. Very few of the recent studies mentioned above are corpus-based, or use data from primarily contemporary sources. A recent study concludes that at least some aspects of the gender system of Norwegian seem to be in transition (Lødrup 2011), which again indicates that there may be good reason to look at the gender assignment of new anglicisms in order to capture some of the most recent trends in this area of grammar. The main source of data for the present study is the Norwegian Newspaper Corpus (http://avis.uib.no/). In addition to presenting data pertaining to gender assignment, the paper also briefly addresses methodological issues such as the suitability of corpora for loanword identification and extraction, and questions of size and representativeness. References Enger, H.-O. (2001). Genus i norsk bør granskes grundigere. Norsk Lingvistisk Tidsskrift 19, 163-183. Enger, H.-O. (2009). The role of core and non-core semantic rules in gender assignment. Lingua 119, 1281-1299. Graedler, A.-L. (1998). Morphological, semantic and functional aspects of English lexical borrowings in Norwegian. Oslo: Scandinavian University Press. Halse, G.E. (2004). Genustilordning i nynorsk: Ei datamaskinell etterprøving. MA thesis, University of Bergen. Johansson, S. & Graedler, A.-L. (2002). Rocka, hipt og snacksy: Om engelsk i norsk språk og samfunn. Kristiansand: Høyskoleforlaget. Kristoffersen, K.E. & Simonsen, H. G. (2009). Tilegnelse av genus hos norske, danske og islandske barn. Presentation of a research project, Cognitive summer seminar, Hamar, June 2009. Lødrup, Helge. 2011. Hvor mange genus er det i Oslo-dialekten? Maal og Minne 2, 120-36. Næss, Å. (2011). Global grammatikk: språktypologi for språklærere. Oslo: Gyldendal akademisk. Onysko, A. (2007). Anglicisms in German: Borrowing, Lexical Productivity, and Written Codeswitching. Berlin, New York: De Gruyter. Trosterud, T. (2001). Genus i norsk er regelstyrt. Norsk Lingvistisk Tidsskrift 19, 29-58.
9 Ke střídání vidu ve vyprávění v češtině François Esvan francois@esvan.net Je známo, že v češtině se sled událostí v minulém čase vypravuje převážně pomocí dokonavých sloves: (1) Břeťa se osprchoval P, oblékl P bílou košili a do kapsy si strčil P pečlivě zabalenou růžovou kravatu od Edity [ ] seběhl P po schodech, nakopl P motorku a vyrazil P do tmy k poslednímu utkání. SYN2005 S. Ivančev (1961) však jako první upozornil na to, že na konci těchto řetězů dokovaných tvarů se nezřídka vyskytují i nedokonavá slovesa, (2) Ukázal P na židli a já jsem se posadil P. Vytáhl P jsem tabák a balil I si cigaretu. SYN2005 a to na rozdíl od jiných slovanských jazyků, např. ruštiny a bulharštiny, kde je v tomto kontextu nedokonavý vid prakticky vyloučen. Touto zvláštností se dále zabývali lingvisté jak z Česka (Křížková 1963), tak ze zahraničí (Galton 1976, Stunová 1993, Dickey 1997). Řeč byla hlavně o tom, jaký význam tyto nedokonavé tvary mají zda ingresivní či eventuálně jiný a do jaké míry je tento jev omezen na určité kategorie lexémů. Tomuto problému se budeme v našem příspěvku věnovat na základě korpusových dat. Vyhledali jsme výskyty jednoho či více nedokonavých tvarů v řetězcích dokonavých sloves v beletristických textech obsažených v korpusech SYN2000, SYN2005 a SYN2010. Rozbor získaných dokladů nám umožnil sestavit inventář sloves vyskytujících se v dotyčném kontextu a upřesnit, jaká je jejich funkce ve vyprávění. Bibliographie DICKEY, S. M., 2000, Parameters of Slavic Aspect. CSLI, Stanford. ESVAN, F., 2009, Notes sur l aspect verbal en marge de la traduction tchèque d un roman de Daniel Pennac. In: Erant in quidam civitate Sborník na počest Daši Bartoňkové. Graeco- -latina bruniensa, 14, 2009, 1 2, 79 91. ESVAN, F., 2010, Studi di corpus in ceco contemporaneo, UNO, Napoli. GALTON, H., 1976, The main functions of the Slavic verbal aspect, Macedonian Academy of Science and Art, Skopje. IVANČEV, S., 1961, Kontekstovo obuslovena ingresivna upotreba na glagolite ot nesvăršen vid v češkija ezik, Godišnik na Sofijskija universitet - filologičeski fakultet, t. 54, 3 (1959/60), Nauka i izkustvo, Sofija. KŘÍŽKOVA, H., 1963, K ingresivnosti v češtině. Slovo a slovesnost, 23, 286 291. STUNOVÁ, A., 2004, A contrastive Analysis of Russian and Czech Aspects: Invariance vs Discourse. Amsterdam. České kontaktové javy na báze Slovenského hovoreného korpusu Katarína Gajdošová katarinag@korpus.sk Českým kontaktovým javom v slovenčine sa v 90. rokoch minulého storočia venovala vo svojich prácach České kontaktové javy v slovenčine (2005) a Komunikatívna efektívnosť
10 českých kontaktových javov v súčasnej slovenčine (1991) Miloslava Sokolová. Bázovým základom jej výskumu sa v tom čase stali kodifikačné príručky, excerpty z dennej tlače, televíznych relácií, ale aj analýzy nahrávok voľných prehovorov študentov na Filozofickej fakulte Univerzity Pavla Jozefa Šafárika v Prešove. Druhý z uvedených príspevkov prináša analýzu použitia českých kontaktových prostriedkov a ich nekontaktových variantov na základe získaných informácií zo sociolingvistického dotazníka, ktorý autorka zostavila. V príspevku sa vrátime po viac ako dvadsiatich rokoch k výsledkom spomínaného sociolingvistického výskumu a porovnáme ho s kontaktovými prostriedkami a ich nekontaktovými variantmi, ktoré dnes zachytávajú slovenské korpusy, osobitne Slovenský hovorený korpus. Minulá aktivní příčestí v paralelních rusko-českých textech Markus Giger markus.giger@unibas.ch Zatímco na rovině systémové je mezi češtinou a ruštinou v participiálním systému nápadná shoda (oba jazyky vykazují příčestí přítomné činné (přicházející, v české tradici zpřídavnělý přechodník minulý ), minulé činné (přišedší, v české tradici zpřídavnělý přechodník minulý ), minulé trpné a dva přechodníky), 1 na textové rovině to vypadá zcela jinak: přechodníky mají v češtině už jen minimální produktivitu, zvlášť přechodník minulý, a příčestí minulé činné, v ruštině značně produktivní v obou videch, má v češtině periferní postavení: je produktivní především u několika mála kořenů s jistou tendencí k terminologizaci (především od kořenů -stoup- a -běh-), většinou není syntakticky doplněno a je stylisticky příznakové, zvlášť pokud není tvořeno od omezeného okruhu sloves, u nichž je nejsilněji produktivní. U řady sloves je značná konkurence s příčestím l-ovým (přišlý, v české tradici zpřídavnělé příčestí minulé činné). Srov. Kopečný (1958), Damborský (1967), Giger (2010). Otevřenou otázkou zatím je fungování aktivního minulého příčestí v ruských a českých paralelních textech: vystupuje české PMČ(š) jako analogon ruského, a pokud ano, u kterých sloves, v jakých sémantických a syntaktických funkcích a jak často? Nahrazuje se ruské PMČ(š) českým l-ovým příčestím? Nahrazuje se ruské PMČ(š) nedokonavého vidu českým příčestím přítomným činným? Jak často vyřeší překladatelé z ruštiny do češtiny problém opisem? Jak běžně naopak nahrazují překladatelé do ruštiny české vedlejší věty ruským PMČ(š)? Jak chápou české l-ové příčestí? Jak vypadá situace v paralelních překladech z třetího jazyka? Na tyto otázky se snaží příspěvek najít odpovědi na základě paralelních korpusů. Literatura: Damborský, J. 1967. Participium l-ové ve slovanštině. Warszawa. (Rozprawy Uniwersytetu Warszawskiego 15) Giger, M. 2010. Příčestí minulé činné na -(v)ší v dnešních českých publicistických textech. Korpus - Gramatika - Axiologie 1, 2, 3-23. Izotov, A. I. 1993. Češskie atributivnye pričastija na fone russkich. Moskva 1 Jediný kategoriální formální rozdíl neexistence příčestí přítomného trpného na -m- v češtině je vyvážen silnou produktivností nedokonavého příčestí minulého trpného na -n/t- v češtině. Srov. k celé problematice Izotov (1993).
11 Kopečny, F. 1958. Přišedší, zahynuvší přišlý, zahynulý (příspěvek k problému slovanského příčestí l-ového). In: Vinogradov, V. V. et al. (red.): Slavjanskaja filologija 2. Moskva, 138-163. Valenční vlastnosti sloves označujících umístění v českém, ruském a německém jazyce Bohuslava Golčáková golcakov@kag.zcu.cz Příspěvek je věnován výzkumu valenčních vlastností českých, ruských a německých sloves, který je prováděn na základě práce s korpusy zmiňovaných jazyků (SYN 2005 zpracovaný ÚČNK, Национальный корпус русского языка, korpusy ěmeckého n jazyka zpracovávané Ústavem pro jazyk německý se sídlem v Mannheimu). Valenční syntax prošla od 60. let 20. století dlouhým vývojem, nicméně na své aktuálnosti neztrácí do současnosti. Již L. Tesniére přisuzoval ve svých Základech strukturální syntaxe (1959) hlavní roli ve větě slovesu a vyjádřil přesvědčení, že sloveso jako strukturální centrum věty otevírá ve větě volná místa, která musejí být pro vytvoření gramaticky správné věty obsazena. Počet a typ těchto míst závisí na situaci, která je slovesem pojmenovávána. V odborné literatuře se nejednou setkáme s názorem, že počet těchto pozic souvisí se sémantikou slovesa (srov. Tesnière 1959, Kacnel son 1972, Apresjan 2006). Důkazem neutuchajícího zájmu lingvistů o danou problematiku v českém jazykovém prostředí je valenční slovník českých sloves VALLEX zpracovávaný kolektivem Ústavu formální a aplikované lingvistiky MFF UK pod vedením doc. M. Lopatkové a doc. Zd. Žabokrtského. Nutno zmínit, že jsou sestavovány valenční slovníky i v jiných jazycích. Nicméně konfrontační studie, které by se věnovaly valenci sloves v několika jazycích, nejsou příliš časté a pokud se objevují, zaměřují se většinou na porovnání valence sloves ve dvou (nikoli více) jazycích. Kromě toho se většina konfrontačních prací zabývá rozdíly na povrchové úrovni věty, tzn. rozdíly ve formálním (morfematickém) vyjádření jednotlivých slovesných doplnění bez ohledu na sémantické vlastnosti zkoumaných sloves. Cílem příspěvku je tedy seznámit s výsledky výzkumu valenčních vlastností sloves, konkrétně sloves označujících umístění v ruském, českém a německém jazyce. Výzkum se opírá o sémantickou klasifikaci vypracovanou kolektivem katedry ruského jazyka Uralské státní univerzity v Jekatěrinburgu. Teoreticko-metodologickou základnu výzkumu valence dané sémantické skupiny sloves tvořily práce ruských, českých i dalších lingvistů v oblasti funkční gramatiky, komunikativní gramatiky, valenční teorie a sémantiky. Výsledkem výzkumu je česko-rusko-německý valenční slovník obsahující 524 slovníkových hesel. Každé slovníkové heslo obsahuje kromě charakteristiky valenční struktury daného i příkladové věty získané excerpcí z výše uvedených korpusů. Výzkum byl prováděn v rámci doktorského studia na Filozofické fakultě Masarykovy univerzity (Ústav slavistiky) a následně pokračoval (a pokračuje) zpracováváním syntaktických (valenčních) vlastností ruských a českých sloves dalších sémantických skupin v rámci projektu FRVŠ řešeného v roce 2011 na Katedře germanistiky a slavistiky Fakulty filozofické ZČU v Plzni.
12 The frequency effect in the production of adjective-noun agreement: A corpus-based study of Russian speech errors Svetlana Gorokhova svetlana1703@gmail.com The paper aims to investigate the role of the frequency effect in computing grammatical agreement, which is traditionally regarded as an algorithmic process, through an analysis of 274 agreement errors (slips of the tongue) spontaneously produced by native speakers of Russian. The errors were collected by recording everyday conversations, telephone conversations, and live TV and radio programs. In Russian (a heavily inflected language), an attribute adjective case form is computed based on the head noun case form. At the same time, different case forms of a noun often use the same attribute adjective form. This may sometimes cause speakers to produce reversed case agreement errors in modifier-head [Adj+N] constructions, selecting an irrelevant head noun case form based on the relevant pre-modifier adjective case form while it is the reverse that has to be done, e.g. [TARGET] Govorit ob okončatel n-yx resul tat-ax rano talk about final-pl.gen/loc result-pl.loc early [ERROR] Govorit ob okončatel n-yx resul tat-ov rano talk about final-pl.gen/loc result-pl.gen early It is too early to talk about the final results. It seems plausible to suggest that processing the adjective whose case inflection markers are homonymic, e.g. GEN/LOC as in the example above, the production system is faced with ambiguous information and has to choose one of the several alternative noun case forms, which may result in the selection of a wrong albeit perhaps more robust form (e.g. genitive instead of locative). I used the disambiguated part of the Russian National Corpus (about 6 mln. tokens) to compute the frequencies of occurrence of target and error modifier-head [Adj+N] constructions and compared the target and error construction frequencies. The comparison revealed that speakers tend to substitute higher-frequency constructions for lower-frequency constructions (p (274) < 0.001). The result suggests that even processes like agreement that have to be algorithmically computed are affected by the speakers implicit knowledge of the distributional patterns of certain grammatical constructions, which is based on their linguistic experience. The error construction is likely to be a recurrent pattern stored in long-term memory that a speaker tends to use as a default schema. In language production, such low-level schemas may have a priority over the general rules of computing agreement.
13 A corpus-based study of gender assignment in recent English loanwords Anne-Line Graedler anneline.graedler@hihm.no This paper examines the gender of recently borrowed English nouns in Norwegian. Gender assignment is part of the morphological integration of borrowed nouns, and although English loanword gender has been dealt with in previous studies (e.g. Graedler 1998; Johansson & Graedler 2002), it is only during the past decade that large corpora of Norwegian have been made accessible for research, and thus enable comprehensive analyses of loanwords based on large corpora of written and spoken [ language] in formal and informal settings from a variety of media (Onysko 2007: 98). Grammars of Norwegian often view gender as a random lexical feature which is for the main part completely unpredictable (e.g. Næss 2011: 126). On the other hand, several recent studies take a principled view of gender assignment as rule-based or dependent on inherent schemas (e.g. Trosterud 2001; Enger 2001; 2009; Halse 2004; Kristoffersen & Simonsen 2009). The gender assignment of loanwords may be regarded as natural test cases for hypotheses about productive gender and synchronous assignment rules, and thus contribute valuable information to the study of gender assignment principles in general, as well as with respect to loanwords in particular. Very few of the recent studies mentioned above are corpus-based, or use data from primarily contemporary sources. A recent study concludes that at least some aspects of the gender system of Norwegian seem to be in transition (Lødrup 2011), which again indicates that there may be good reason to look at the gender assignment of new anglicisms in order to capture some of the most recent trends in this area of grammar. The main source of data for the present study is the Norwegian Newspaper Corpus (http://avis.uib.no/). In addition to presenting data pertaining to gender assignment, the paper also briefly addresses methodological issues such as the suitability of corpora for loanword identification and extraction, and questions of size and representativeness. References Enger, H.-O. (2001). Genus i norsk bør granskes grundigere. Norsk Lingvistisk Tidsskrift 19, 163-183. Enger, H.-O. (2009). The role of core and non-core semantic rules in gender assignment. Lingua 119, 1281-1299. Graedler, A.-L. (1998). Morphological, semantic and functional aspects of English lexical borrowings in Norwegian. Oslo: Scandinavian University Press. Halse, G.E. (2004). Genustilordning i nynorsk: Ei datamaskinell etterprøving. MA thesis, University of Bergen. Johansson, S. & Graedler, A.-L. (2002). Rocka, hipt og snacksy: Om engelsk i norsk språk og samfunn. Kristiansand: Høyskoleforlaget. Kristoffersen, K.E. & Simonsen, H. G. (2009). Tilegnelse av genus hos norske, danske og islandske barn. Presentation of a research project, Cognitive summer seminar, Hamar, June 2009. Lødrup, Helge. 2011. Hvor mange genus er det i Oslo-dialekten? Maal og Minne 2, 120-36. Næss, Å. (2011). Global grammatikk: språktypologi for språklærere. Oslo: Gyldendal akademisk. Onysko, A. (2007). Anglicisms in German: Borrowing, Lexical Productivity, and Written Codeswitching. Berlin, New York: De Gruyter. Trosterud, T. (2001). Genus i norsk er regelstyrt. Norsk Lingvistisk Tidsskrift 19, 29-58.
14 České evidenciální markery a jejich uplatnění v publicistických textech Milada Hirschová, Soňa Schneiderová Milada.Hirschova@seznam.cz Zkoumání evidenciálnosti se v posledních letech rozvíjí jednak jako nová perspektiva zkoumání modality, jednak i kontrastivně, při srovnávání jednotlivých jazyků. Přehled českých evidenciálních markerů byl vytvořen v rámci české participace na výzkumném projektu DFG Funktionsweisen und Struktur evidenzieller Markierungen im Slavischen (ved. projektu prof. Björn Wiemer, Johannes-Gutenberg-Universität Mainz). Teoreticky se opírá o Plungjanovo (2001) vymezení sémantických oblastí (hodnot) uvnitř evidenciálnosti (percepční evidence vs. evidence založené na vyvozování + evidence opřené o sdělení) a o práci Aichenvaldové (2004). Čeština patří mezi jazyky, které vyjadřují evidenciálnost lexikálně, nejčastěji pomocí adverbiálních/částicových výrazů a pomocí syntaktických konstrukcí se slovesy smyslových vjemů a slovesy myšlení. Při průzkumu realizovaném v rámci zmíněného projektu se potvrdil předpoklad, že mluvčí ne vždy rozlišují mezi specifikací zdroje informace (evidence) a svým hodnocením stupně pravdivosti tvrzení (epistémický postoj), proto se další zkoumání obrátilo k publicistickým textům, u nichž je specifikace informačních zdrojů součástí diskursových předpokladů, resp. rysem spoluvytvářejícím textový typ. Analýza korpusových dat hodlá zjistit frekvenci, distribuci a preferenční výskyt jednotlivých evidenčních markerů a klade si za cíl stanovit jejich funkční užití v možných kontextech publicistického textu. S tím souvisí i popis míry vlivu jednotlivých aspektů evidence na vyjádření stupně validity, a tedy kvality informace. Využití korpusů korespondence pro účely (nejen) slovotvorných analýz Zdeňka Hladká zdena@phil.muni.cz Příspěvek bude zaměřen na lingvistickou využitelnost malých specializovaných korpusů. Nejprve se pokusíme krátce odpovědět na otázku, zda má smysl takové korpusy vůbec vytvářet, a pokud ano, jaké postupy volit. Problematika bude konkretizována na příkladu několika korpusů soukromé korespondence vytvořených nebo připravovaných v Ústavu českého jazyka na FF MU v Brně (KSKdopisy součást ČNK, KSKe-maily, Korpus přijaté a odeslané korespondence Bedřicha Smetany, Korpus soukromé korespondence 20. století). Dále se soustředíme na využitelnost korpusů korespondenčních textů pro lexikologickolexikografický výzkum. Stručně budou prezentovány dosavadní excerpční aktivity, lexikografické sondy i lexikologické analýzy opírající se o materiál KSKdopisy. Vzhledem k zaměření konference bude hlavní pozornost věnována několika tématům z oblasti slovotvorby, pro jejichž zkoumání je soukromá korespondence zvláště vhodným pramenem. Konkrétně hypokoristickým variantám rodných jmen a aktualizačnímu tvoření apelativ. Uvedeny budou výsledky slovotvorné a frekvenční analýzy 1000 různých hypokoristických obměn rodných jmen z KSKdopisy (reflektován bude významný podíl studentů FF MU na zpracování tohoto úkolu). Ve snaze o představení korespondenčních textů jako východiska pro relativně komplexní výzkum hypokoristik budou poznatky týkající se slovotvorby propojeny se sledováním pragmalingvistických aspektů odvoditelných ze zapojení hypokoristik do konkrétních textů. Poukážeme i na některé zajímavosti diachronní.
15 Jazyková kreativita textů soukromé korespondence v oblasti tvorby apelativ bude dokumentována jak na novotvarech opírajících se o produktivní slovotvorné modely, tak na novotvarech, které prezentují záměrnou snahu narušit systémová pravidla. Automatická slovnědruhová desambiguace slova to v ustálených větných výrazech Milena Hnátková Milena.Hnatkova@ff.cuni.cz Příspěvek se zabývá automatickou slovnědruhovou desambiguací poměrně frekventovaného užití slovního tvaru to v českých ustálených větných výrazech, zejména v mluvené češtině, a následně i problémem určení pádu v případě užití zájmena to ve větných frazémech. Forma to je homonymní, výsledkem automatické morfologické analýzy tohoto slova je zájmeno ten jako neutrum v singuláru (PDNS1, například ve spojení: to se teprve ukáže, to je ale překvapení) nebo neutrum v akuzativu (PDNS4, například ve spojení: kdo to má vydržet, já to říkám pořád) a částice to (TT, například ve spojení: to pěkně děkuju, to to trvá, to budeš koukat). Rozpoznat pád v českém textu počítačovým programem v případě homonymního tvaru akuzativu (nepředložkového) a nominativu je obtížné. Autor se zaměří především na desambiguaci slova to jako částice. Vyhledávací procedura ustálených slovních spojení je součástí automatické morfologické desambiguace, kdy je řešena zejména slovnědruhová desambiguace v negramatických spojeních a frazémech. Autor se v příspěvku konkrétně zaměří na ustálená spojení uvedená ve Slovníku české frazeologie a idiomatiky (část Výrazy větné) a na základě automatického vyhledávání větných ustálených spojení v českých textech v korpusu SYN2010: a) představí typy větných výrazů obsahujících slovo to b) dle úspěšnosti dosavadního automatického značkování ukáže příklady, kdy automatická desambiguace pomocí obecných gramatických pravidel není spolehlivá a jedná se převážně o užití frazému. c) pokusí se vytvořit seznam netranzitivních sloves (bez akuzativní valence) pro potřeby automatické desambiguace Se vám to nelíbí? Jambické začátky českých výpovědí / dialogických replik: v mluvené češtině a beletristické stylizaci Jana Hoffmannová, Ivana Kolářová hoffmannova@ujc.cas.cz, kolarova@kerio.ped.muni.cz Při stylizaci spontánního, nepřipraveného, expresivního mluveného projevu v současných uměleckých textech (prozaických, dramatických, ale i např. v komiksech) vystupují do popředí jako jeden z nejvýraznějších syntaktických rysů jambické začátky výpovědí, resp. replik jednoslabičnými slovy se, si, sem, sme, ste, mě, mi, tě, ti, bych, by Sgall a Hronek (1992) je označují jako příklonky, resp. předklonky; podle J. Tomana (2002) či A. Svobody (2002) nejde o klitika, všichni zmínění autoři tu však uvažují o výsledcích slovosledné inverze (Se mu to nepovedlo = Nepovedlo se mu to ) nebo procesů eliptických (Bych si taky myslel = To bych si taky myslel ). Ve hře jsou však zřejmě i další motivace, např. fonetické, související se specifickými technikami mluveného projevu. Za pozornost stojí i vztah elize/nevyjádřenosti u
16 já byl doma sem byl doma; nebo homonymie počátkového si, které může být jak zvratným zájmenem (si nemysli), tak tvarem slovesa být (si jí to řekla?). Častý je tento typ začátků podle našich výzkumů např. i v komunikaci mladých lidí na chatu, tj. v psaných textech silně ovlivněných projevy mluvenými. Rády bychom s pomocí korpusů mluvené češtiny zjistily, zda tyto jambické začátky výpovědí / replik představují výrazný a neodlučitelný znak současné mluvené češtiny, autentických českých dialogů nebo zda jde spíše o určitý mýtus, vydatně živený českými beletristy, kteří usilují o stylizaci ležérního vyjadřování. K tomuto účelu využijeme i data z beletristických textů obsažených v ČNK (SYN2000, SYN2005, SYN2010) a zaměříme se na dialogy postav. Osobní a přivlastňovací zájmena v češtině pro cizince: komplexnost a simplifikace v zrcadle současného úzu Andrea Hudousková A.Hudouskova@seznam.cz Studenti se již v počáteční fázi studia češtiny jako cizího jazyka setkávají s deklinačními paradigmaty osobních a přivlastňovacích zájmen, která se vyznačují velkou tvarovou variabilitou. Příspěvek se zaměří jednak na variantní tvary osobních zájmen on, ono v genitivu a akuzativu, jednak na konkurenci adjektivních a zájmenných tvarů přivlastňovacích zájmen. Jednotlivé učebnice češtiny pro cizince se v popisu deklinace těchto zájmen výrazně liší: na krajních pólech pomyslné škály stojí na jedné straně Čeština pro pokročilé (2008) autorek Confortiové a Turzíkové, na straně druhé Česky krok za krokem II. (2009) od Holé a Bořilové, ostatní učební materiály lze z tohoto hlediska klást mezi ně. Co se týče deklinace osobních zájmen on/ono, uvádějí Confortiová Turzíková veškeré jejich tvary, včetně těch, které jsou dnes již řídké a mají příznak knižnosti, tj. akuzativní tvary jej (ak. sg. m. neživ./n.) a je (ak. sg. n.). Přitom důsledně rozlišují mezi životným a neživotným maskulinem on: tzn. mezi akuzativními tvary ho/jeho/na něho (m. živ.) a jej/jej/na něj (m. neživ.). Naopak Holá Bořilová mezi zájmeny on a ono, podobně jako mezi životnými a neživotnými tvary zájmena on nerozlišují a pro akuzativ i genitiv těchto zájmen uvádějí tvary ho/něho, něj (s poznámkou, že něho v akuzativu je tvar maskulina životného). Různá míra konzervatismu se projevuje i v popisu přivlastňovacích zájmen. Zatímco Confortiová Turzíková připouštějí dubletní adjektivní a zájmenné tvary pouze v nom./ak. sg./pl., Holá Bořilová uvádějí, podobně jako současné mluvnice češtiny, dublety pro celý singulár feminina, nom/ak sg. n. a nom/ak pl. všech rodů. Navíc upozorňují na obecněčeské varianty s hláskovými změnami é/ý, ý/ej a také obecněčeské zakončení instr. pl. -ma. Cílem příspěvku je na základě korpusového výzkumu zjistit následující údaje: 1) míru rozlišování rodu, životnosti a pádu (ak/gen) u osobních zájmen on/ono v současném psaném a mluveném úzu, konkrétně: a) četnost a distribuci jednotlivých dubletních forem; b) míru rozlišování životnosti u akuzativních tvarů jeho, jej / něho, něj; c) poměr výskytu akuzativních tvarů ho, je, jej, jeho / něho, něj zájmena ono; 2) poměr výskytu dublet přivlastňovacích zájmen v přímých a nepřímých pádech. Ze zjištěných faktů budou v závěru příspěvku vyvozeny důsledky pro způsob prezentace zmíněných deklinačních paradigmat ve výuce češtiny pro cizince. Je žádoucí, aby si studenti aktivně osvojili tvary časté a progresivní. Toho lze dosáhnout pouze na základě důkladného popisu současného úzu.
17 Research on stressed prepositions in Russian: a corpus-based approach Ilya B. Itkin, Svetlana I. Pereverzeva, Margarita A. Tyurenkova isv@gol.ru, p_sveta@hotmail.com, margarita_tur@mail.ru The paper relates to the study of collocations of the type stressed preposition + noun (SPN-collocations) in Russian. This study aims at describing the dynamics of occurrence of such collocations in the Russian language from the 18 th century up to the present, as well as establishing the most significant grammatical tendencies in their usage. The research is based on data of 2 types: some examples are taken from the Russian National Corpus (RNC, www.ruscorpora.ru), others are selected from elsewhere. The latter allow us to estimate the adequacy of the RNC in reflecting a real linguistic situation regarding Russian stressed prepositions. The RNC is a complex system of sub-corpora. Our research is based on one of them the Accentological Corpus (AC). Particularly, the AC data prove to be extremely helpful for describing the historical development of the 2 grammatically nontrivial groups of SPNcollocations. One group embraces collocations with nouns denoting living creatures in form of the old inanimate accusative case (cf. на' люди, на' конь, конь о' конь). As there was no animate accusative in Early Old Russian, these collocations should evidentially be more frequent in older texts. However, the AC shows that they occur not only in the 18th and 19th centuries, but also in the 20th century; as for the collocation на' люди 'in the public eye', it becomes widely spread no earlier than in the beginning of the 20th century. The other group includes SPN-collocations with nouns in form of the so-called second genitive case (this case is possible only for some masculine nouns and requires the - u ending instead of the typical -a), cf. и'з лесу, о'т роду, со' смеху. The corresponding collocations with the typical first genitive also exist in Russian, but generally their stressed component is the noun: из ле'са, от ро'да, со сме'ха. Studying the AC data proves that the restriction on using the SPN-collocations with first genitive is presently stronger than it used to be in the 18th and early 19th century. The AC may help to find the SPN-collocations that are missed in the Modern Russian dictionaries. E.g., the preposition на in на спор is unstressed according to the dictionaries, whereas the AC shows that it can be stressed. On the other hand, the AC data sometimes give false impression of the real linguistic situation. E.g., for the collocation до дому the AC provides 5 examples with stress on до out of total 38. This may cause to think that the stress on the preposition in this collocation is rather rare, which is not correct. Nové možnosti korpusového výzkumu českých performativních direktivních a závazkově-direktivních sloves Andrey Izotov a.i.izotov@mail.ru Referát je věnován novým možnostem korpusového výzkumu českých performativních direktivních a závazkově-direktivních (podle mainstreamové Searlovy klasifikace) sloves vzniklých díky rozvoji českého národního korpusu během posledního desetiletí a navazuje na referát z loňské konference Čeština v pohledu synchronním a diachronním (1. 3. června 2011, ÚJČ).
18 Konstrukce s performativními direktivními slovesy a konstrukce s imperativem tvoří v současné češtině centrum funkčně-sémantické kategorie výzvy, která je chápána jako souhrn subkategorií tvořených na základě aktantního rámce predikátu, přičemž nejdůležitějšími jsou tři subkategorie tvořené na základě následujících tří kategoriálních situací: Subkategorie 1. preskriptorem je mluvčí, konatelem je posluchač/posluchači ( výzva 2. osoby ); Subkategorie 2. preskriptorem je mluvčí, konatelem jsou posluchač/posluchači a mluvčí ( inkluzívní výzva ); Subkategorie 3. preskriptorem je mluvčí, konatelem není posluchač ani mluvčí ( výzva 3. osoby ). Jádro každé z těchto tří subkategorií je tvořeno konstrukcemi s imperativem, které jsou konvencializovány pro vyjádření ilokučně univerzální výzvy a explicitními performativními konstrukcemi s ilokučními slovesy, které jsou konvencializovány pro vyjádření ilokučně specializované výzvy. Jádro první subkategorie je zároveň jádrem celé funkčně-sémantické kategorie výzvy. Explicitní performativní konstrukce mají v současné češtině výchozí strukturu souvětnou: performativně užitý prézentní tvar 1. osoby indikativu ilokučního slovesa tvoří hlavní větu, kdyžto propoziční obsah výpovědi je ztvárněn formou věty vedlejší, srov.: Proto vás prosím, abyste odešli (SYN2010). K tvoření takových performativních konstrukcích jsou teoreticky uživatelná následující direktivní a závazkově direktivní slovesa: doporučovat; dovolovat; hlásit se; nabádat; nabízet; napomínat; nařizovat; navrhovat; objednávat; obsílat; odporučovat; poroučet; pověřovat; požadovat; prosit; přihlašovat se; přikazovat; přimlouvat se; připomínat; ptát se; radit; rozkazovat; schvalovat; tázat se; ukládat; upozorňovat; varovat; velet; volat; vybízet; vyprošovat si; vyzývat; zakazovat; zaklínat; zamlouvat si; zapovídat; zapřísahat; zvát; žádat. Pro vyhledávaní základních typů explicitních performativních konstrukcí v SYN jsme využili následujících dotazů (je samozřejmé, že v 1. pozici dotazu jsme vystřídali všechna zkoušená performativní slovesa, nikoliv jenom sloveso "doporučit"): Pro vyhledání výzvy 2. osoby [word="[dd]oporučuj[iu]"] []{0,10} [word="abyste"] within <s> [word="[dd]oporučuj[iu]"] []{0,10} [word="abys"] within <s> [word="[dd]oporučuj[iu]"] []{0,10} [word="aby"][]{0,10} [word="ses"] within <s> [word="[dd]oporučuj[iu]"] []{0,10} [word="aby"][]{0,10} [word="sis"] within <s> Pro vyhledání inkluzívní výzvy: [word="[dd]oporučuj[iu]"] []{0,10} [word="abychom"] within <s> [word="[dd]oporučuj[iu]"] []{0,10} [word="abysme"] within <s> Pro vyhledání výzvy 3. osoby: [word="[dd]oporučuj[iu]"] []{0,10} [word="aby"] within <s> Nalezené kontexty byly podrobeny vizuální kontrole pro rozlišení performativního a neperformativního užití. Vypadá na to, že korpus je vhodný pro vyhledání právě základních typů explicitních performativních konstrukcí, protože takové vyhledání se dá formalizovat lépe, než vyhledání performativních konstrukcí s transformovanou diktumní nebo modisní částí. Vyhledávání transformovaných performativních konstrukcí v korpusu je složitější a vyžaduje náročnější vizuální kontrolu, je však také možné.