NomVallex: Valenční slovník českých substantiv založený na korpusu
|
|
- Blažena Jandová
- před 6 lety
- Počet zobrazení:
Transkript
1 NomVallex: Valenční slovník českých substantiv založený na korpusu Veronika Kolářová, Jarmila Panevová, Jana Klímová, Anna Vernerová Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova Praha, Seminář formální lingvistiky 1
2 Osnova Valenční slovníky českých substantiv Teorie valence substantiv Valenční slovník NomVallex provázanost s Vallexem vybrané sémantické třídy Substantiva mluvení Kvantitativní analýza valenčního chování substantiv v pražských závislostních korpusech Praha, Seminář formální lingvistiky 2
3 NomVallex Valenční slovník českých substantiv založený na korpusu GAČR projekt ( ; GA S) Tým: Veronika Kolářová, Jarmila Panevová, Jana Klímová, Anna Vernerová Pracoviště: Ústav formální a aplikované lingvistiky, MFF UK, Praha Teoretický rámec: valenční teorie funkčního generativního popisu aktanty a volná doplnění (Panevová), valenční rámce Valence deverbativních substantiv verbální substantiva (VS): -ní/-tí, např. vyrobení / vyrábění dějová substantiva (DS): různé přípony, včetně nulového sufixu, např. výroba Korpusová data: PDT, ČNK a Araneum Bohemicum Sémantické třídy, všechny významy substantiv, kombinace aktantů Praha, Seminář formální lingvistiky 3
4 Vallex Vallex, PDT-Vallex, NomVallex Valenční slovník zachycující valenční strukturu českých sloves v jejich jednotlivých významech, které charakterizuje pomocí glos a příkladů českých sloves, která odpovídají lexikálním jednotkám, tedy vždy danému slovesu v daném významu PDT-Vallex Valenční slovník budovaný při anotacích taktogramatické roviny Pražského závislostního korpusu (PDT) slovesa, substantiva (3727 hesel), adjektiva NomVallex Rozšiřuje Vallex: dodání substantivních hesel Rozšiřuje PDT-Vallex: detailnější způsob zpracování Praha, Seminář formální lingvistiky 4
5 Slovník slovesných, substantivních a adjektivních vazeb a spojení (Svozilová, Prouzová, Jirsová 2005) Dosud jediná tištěná publikace zachycující valenci českých substantiv a adjektiv slovníkovou formou Oproti Slovesům pro praxi je vypuštěn repertoár sémantických rysů Uvádí příslušnou vazbu nebo výčet vazeb spolu s ilustračním materiálem, nikoli valenční rámce Substantiva uváděna pouze výběrově Kritérium pro zařazení do slovníku: relevance vazby nikoli např. genitiv přivlastňovací nebo podmětový Zachycena pouze tzv. pravá valence zpráva ž o něčem, o někom; odněkud; pro někoho: každodenní z-y o teroristických útocích // z. o hrozících přívalových deštích // Praha, Seminář formální lingvistiky 5
6 Faktory ovlivňující valenci substantiv Praha, Seminář formální lingvistiky 6
7 Faktory ovlivňující valenci substantiv Co substantivum označuje děj / stav abstraktní výsledek děje konkrétní výsledek děje / věc / místo / osoba Praha, Seminář formální lingvistiky 7
8 Faktory ovlivňující valenci substantiv Co substantivum označuje děj/ stav abstraktní výsledek děje konkrétní výsledek děje / věc / místo / osoba syntaktická derivace Praha, Seminář formální lingvistiky 8
9 Faktory ovlivňující valenci substantiv Co substantivum označuje děj / stav abstraktní výsledek děje konkrétnívýsledek děje / věc / místo / osoba syntaktická derivace lexikální derivace Praha, Seminář formální lingvistiky 9
10 Faktory ovlivňující valenci substantiv Co substantivum označuje děj / stav abstraktní výsledek děje konkrétní výsledek děje / věc / místo / osoba syntaktická derivace hranice mezi syntaktickou a lexikální derivací lexikální derivace Praha, Seminář formální lingvistiky 10
11 Faktory ovlivňující valenci substantiv Co substantivum označuje děj / stav abstraktní výsledek děje konkrétní výsledek děje / věc / místo / osoba syntaktická derivace hranice mezi syntaktickou a lexikální derivací lexikální derivace Způsob tvoření substantiv, která mohou označovat děj produktivní (-ní/-tí, např. vyrobení / vyrábění, tzv. verbální substantiva) neproduktivní (různé přípony, včetně nulového sufixu, např. výroba, tzv. dějová substantiva) Zapojení v rámci konstrukcí s funkčními slovesy jmenná část konstrukce (poctít koho vzdát poctu.cphr komu pocta komu) Prominentní postavení genitivní pozice syntaktická homonymie (varování cestujících.act/addr varování cestujícím) Praha, Seminář formální lingvistiky 11
12 Typické valenční chování substantiv Označují děj nebo stav jako základové sloveso Dědí valenční rámec slovesa (Panevová 2000) aktanty: Aktor (ACT), Patiens (PAT), Adresát (ADDR), Efekt (EFF), Origin (ORIG) obligatorní volná doplnění: Směr (např. DIR3, příjezd domů), Způsob (MANN, chovat se slušně slušné chování) Formy podléhají typickým posunům (Panevová 2000, Karlík 2000) např. Ak Gen, varování cestujících.addr Povrchové realizace participantů sloves Nom Gen Dat Ak Loc Instr PS Inf VV Adv Pos Gen Dat Loc Instr PS Inf VV Adv Adj Povrchové realizace participantů substantiv Praha, Seminář formální lingvistiky 12
13 Specifické valenční chování substantiv Úzce vázáno na posun ve významu substantiva už nikoli děj nebo stav jako u základového slovesa Specifické vlastnosti valenčních doplnění specifické formy (odpovídají specifickým posunům, Kolářová, 2010) např. Ak Dat, varování cestujícím.addr redukce počtu valenčních doplnění prostá redukce (dovtípit se čeho x *důvtip čeho) zabudování aktantu (Panevová, 2000) např. činitelská jména zabudovávají ACT, učitel kdo učí změna charakteru valenčního doplnění ze slovesného na substantivní (Piťha, 1981) např. Patiens Material (MAT) / Partitiv balení másla.pat do obalu brigádníky.act jedno balení másla.mat ( kontejner ) Praha, Seminář formální lingvistiky 13
14 Substantiva v PDT-Vallexu Valenční slovník vznikající při anotacích Pražského závislostního korpusu (PDT): PDT-Vallex v PDT2.0 (2006): 3727 substantivních hesel Alevtina Bémová; jmenné části konstrukcí s funkčními slovesy: Veronika Kolářová Pouze substantiva a jejich významy (včetně odpovídajících valenčních rámců), které se vyskytly v datech PDT * balení ACT(.2,.7,.u) PAT (.2,.u)?EFF(na-1[.4],v-1[.4],do-1[.2]) v-w112f1 Used: 3x (balit) balení másla PAT na jednotlivé porce.eff?mat (.2) v-w112f2 Used: 2x balení másla.mat ve fólii dárkové balení vína.mat EMPTY v-w112f3 Used: 2x (způsob provedení) kniha v brožurkovém balení Praha, Seminář formální lingvistiky 14
15 Substantiva v PDT-Vallexu Valenční slovník vznikající při anotacích Pražského závislostního korpusu (PDT): PDT-Vallex v PDT2.0 (2006): 3727 substantivních hesel Alevtina Bémová; jmenné části konstrukcí s funkčními slovesy: Veronika Kolářová Pouze substantiva a jejich významy (včetně odpovídajících valenčních rámců), které se vyskytly v datech PDT syntaktická derivace, dědí valenční rámec slovesa, typické valenční chování * balení ACT(.2,.7,.u) PAT (.2,.u)?EFF(na-1[.4],v-1[.4],do-1[.2]) v-w112f1 Used: 3x (balit) balení másla PAT na jednotlivé porce.eff?mat (.2) v-w112f2 Used: 2x balení másla.mat ve fólii dárkové balení vína.mat EMPTY v-w112f3 Used: 2x (způsob provedení) kniha v brožurkovém balení Praha, Seminář formální lingvistiky 15
16 Substantiva v PDT-Vallexu Valenční slovník vznikající při anotacích Pražského závislostního korpusu (PDT): PDT-Vallex v PDT2.0 (2006): 3727 substantivních hesel Alevtina Bémová; jmenné části konstrukcí s funkčními slovesy: Veronika Kolářová Pouze substantiva a jejich významy (včetně odpovídajících valenčních rámců), které se vyskytly v datech PDT syntaktická derivace, dědí valenční rámec slovesa, typické valenční chování * balení ACT(.2,.7,.u) PAT (.2,.u)?EFF(na-1[.4],v-1[.4],do-1[.2]) v-w112f1 Used: 3x (balit) balení másla PAT na jednotlivé porce.eff?mat (.2) v-w112f2 Used: 2x balení másla.mat ve fólii dárkové balení vína.mat EMPTY v-w112f3 Used: 2x (způsob provedení) kniha v brožurkovém balení lexikální derivace, kontejner, specifické valenční chování: redukce počtu valenčních doplnění, aktant MAT Praha, Seminář formální lingvistiky 16
17 Substantiva v PDT-Vallexu Valenční slovník vznikající při anotacích Pražského závislostního korpusu (PDT): PDT-Vallex v PDT2.0 (2006): 3727 substantivních hesel Alevtina Bémová; jmenné části konstrukcí s funkčními slovesy: Veronika Kolářová Pouze substantiva a jejich významy (včetně odpovídajících valenčních rámců), které se vyskytly v datech PDT syntaktická derivace, dědí valenční rámec slovesa, typické valenční chování * balení ACT(.2,.7,.u) PAT (.2,.u)?EFF(na-1[.4],v-1[.4],do-1[.2]) v-w112f1 Used: 3x (balit) balení másla PAT na jednotlivé porce.eff?mat (.2) v-w112f2 Used: 2x balení másla.mat ve fólii dárkové balení vína.mat EMPTY v-w112f3 Used: 2x (způsob provedení) kniha v brožurkovém balení lexikální derivace, kontejner, specifické valenční chování: redukce počtu valenčních doplnění, aktant MAT lexikální derivace, prázdný valenční rámec Praha, Seminář formální lingvistiky 17
18 PDT-Vallex vs. NomVallex PDT-Vallex: pouze substantiva a jejich významy (včetně odpovídajících valenčních rámců), které se vyskytly v datech PDT-korpusů platí i pro slovesa, takže při mapování významů substantiv na základová slovesa by základové sloveso mohlo chybět pouze ty aktanty a jejich formy, které se vyskytly v datech PDT-korpusů NomVallex: rozšíření pojetí lexikografického zpracování širší korpusová datová základna (ČNK, Araneum) sémantické třídy konzistentní zpracování valence substantiv náležejících k jedné sémantické třídě jak dějová substantiva, tak odpovídající verbální substantiva odvozená od obou vidových protějšků návrh, navržení/navrhování všechny významy substantiv všechny aktanty a formy, všechny doložené kombinace doplňující informace specifické valenční chování typ substantiva (dějové, abstraktní výsledek děje, konkrétum) NomVallex: provázanost s Vallexem Praha, Seminář formální lingvistiky 18
19 NomVallex: provázanost s Vallexem Stejný formát anotace některé shodné atributy atributy jmen Lexém: více lemmat zejména verbální substantiva (pf / impf, např. vyzvání / vyzývání) Mapování substantivních lexikálních jednotek (LU) na slovesné lexikální jednotky odkaz na identifikátor slovesné lexikální jednotky sémantická třída dané lexikální jednotky valenční rámec Stejný vyhledávací program V budoucnu: stejný vzhled webových stránek Výhody možnost srovnání slovesných a substantivních lexikálních jednotek valenční rámce (typické vs. specifické formy, počet forem, aktanty) úbytek nebo nárůst počtu významů u jednotlivých typů substantiv možnost vyhledávání Praha, Seminář formální lingvistiky 19
20 Praha, Seminář formální lingvistiky 20
21 Praha, Seminář formální lingvistiky 21
22 Praha, Seminář formální lingvistiky 22
23 Praha, Seminář formální lingvistiky 23
24 Praha, Seminář formální lingvistiky 24
25 Sémantické třídy v NomVallexu Vybráno pět sémantických tříd: Communication, Exchange, Contact, Mental action, Psychological nouns třídy vytipovány na základě předchozího zkoumání valenčního chování substantiv důležitý faktor výběru: specifické valenční chování Příslušnost k sémantické třídě vychází z Vallexu je stanovena na základě zařazení základových sloves Manuální odvození verbálních a dějových substantiv Ruční pročištění vyřazena substantiva, která si uchovala jen významy svého základového slovesa patřící k jiné sémantické třídě doplněna některá substantiva dobře reprezentující valenční chování své sémantické třídy, jejichž základová slovesa však nejsou ve slovníku Vallex vůbec uvedena Praha, Seminář formální lingvistiky 25
26 NomVallex: Výběr substantiv Praha, Seminář formální lingvistiky 26
27 NomVallex: Výběr substantiv Praha, Seminář formální lingvistiky 27
28 NomVallex: Výběr substantiv Odvození substantiv apel apelování argument argumentace argumentování bavení se blahopřání četba čtení ctění definice Praha, Seminář formální lingvistiky 28
29 NomVallex: Výběr substantiv Odvození substantiv apel apelování argument argumentace argumentování bavení se blahopřání Pročištění seznamu apel apelování argument argumentace argumentování bavení se blahopřání četba čtení ctění definice četba čtení ctění definice Praha, Seminář formální lingvistiky 29
30 NomVallex: Výběr substantiv Odvození substantiv apel apelování argument argumentace argumentování Pročištění seznamu apel apelování argument argumentace argumentování Doplnění seznamu apel apelování argument argumentace argumentování bavení se blahopřání četba čtení ctění definice bavení se blahopřání četba čtení ctění definice bavení se blahopřání četba čtení debata debatování definice Praha, Seminář formální lingvistiky 30
31 Pokrytí sémantických tříd v NomVallexu Pracovní heslář: 1230 lemmat substantiv Cíl: hesel Vallex Communication (140), Exchange (80), Mental action (100), Contact (40), Psychological nouns (40) Communication Exchange Contact Mental action Psychological verbs Total Slovesa (LU) NomVallex Verbální substantiva Dějová substantiva Celkem NomVallex Praha, Seminář formální lingvistiky 31
32 Současný stav anotací NomVallexu Pracovní verze Ze všech sémantických tříd: 120 lexikálních jednotek (rámců) v 56 lexémech (vyzvání-vyzývání), což odpovídá 70 lemmatům (vyzvání vs. vyzývání), resp. nerozlišujeme-li homonyma (např. vyložení-vykládání-i, vyloženívykládání-ii), tak 66 lemmatům. Odpovídající počet lexikálních jednotek pro vidové protějšky zvlášť: 145 LU. Communication 98 lexikálních jednotek (rámců) v 53 lexémech, což odpovídá 65 lemmatům, resp. nerozlišujeme-li homonyma, tak 65 lemmatům. Odpovídající počet lexikálních jednotek pro vidové protějšky zvlášť: 114 LU. Praha, Seminář formální lingvistiky 32
33 Valence substantiv pod drobnohledem Zajímavosti Nárůst / úbytek počtu adnominálních forem oproti základovému slovesu Specifické valenční chování specifické posuny v povrchových realizacích aktantů +/- aktant Stylistické varianty námitky z řad demokratů, otázky nad budoucností festivalu, výtky na adresu novinářů Možnost/nemožnost vyjádření typických forem Rozdíly mezi perfektivními a imperfektivními verbálními substantivy Stejné formy aktantů výzva ke všem zemím.addr v oblasti k nepoužívání.pat chemických zbraní Posuny ve významu oproti základovému slovesu Praha, Seminář formální lingvistiky 33
34 Typické a specifické posuny Povrchové realizace participantů sloves Nom Gen Dat Ak Loc Instr PS Inf VV Adv Pos Gen Dat Loc Instr PS Inf VV Adv Adj Povrchové realizace participantů substantiv Povrchové realizace participantů sloves Nom Gen Dat Ak Loc Instr PS Inf VV Adv Pos Gen Dat Loc Instr PS Inf VV Adv Adj Povrchové realizace participantů substantiv Praha, Seminář formální lingvistiky 34
35 Nárůst počtu adnominálních forem Sloveso ACT(f1;obl) ADDR(f2;obl) PAT(f3;obl) Verbální substantivum ACT(f1a,f1b,f1c;obl) ADDR(f2;obl) PAT(f3a,f3b;obl) Dějové substantivum ACT(f1a,f1b,f1c,f1d;obl) ADDR(f2a,f2b;obl) PAT(f3a,f3b,f3c;obl) Počet kombinací: p 1 p 2 p 3 kde p 1, p 2 a p 3 jsou počty forem u prvního, druhého a třetího doplnění mínus negramatické kombinace, např. jejich.pat bití chlapců.act Při zohledňování slovosledných variant bude možností 6 víc mínus negramatické kombinace, např. výzva k lidu.addr prezidentova.act vyzvat vyzvání vyzývání výzva ACT(1;obl) ADDR(4;obl) PAT(k+3,na+4,inf,aby,ať,že;obl) ACT(2,7,pos,ze_strany+2;obl) ADDR(2,pos;obl) PAT(k+3,na+4,inf,aby,ať,cont;obl) (2,pos,od+2,ze_strany+2;obl) ADDR(3,k+3;obl) PAT(k+3,na+4,o+4,inf,aby,ať,že;obl) Specifické posuny, navíc často analogie k valenci významově blízkých substantiv námitka, že je podjatý; námitka podjatosti/z podjatosti/na podjatost/proti podjatosti/k podjatosti/vůči podjatosti Praha, Seminář formální lingvistiky 35
36 Praha, Seminář formální lingvistiky 36
37 Praha, Seminář formální lingvistiky 37
38 Úbytek forem Spíše vzácné případy známka posunu ve významu PAT u instruovat / instruování / instruktáž / instrukce PAT(o+6,k+3,inf,aby,ať,že,cont;obl) instruovat / instruování / instruktáž navíc: PAT(v+6) přítomné svědky.addr instruovala v provádění.pat resuscitace; Usnadňují naladění televizoru i instruování diváka.addr ve výběru programů.pat; Josef Svoboda provádí instruktáž členů.addr jednotky v používání.pat nových dýchacích přístrojů; instrukce chybí možnost vyjádřit PAT(v+6) s instrukcí četníkům.addr, aby pátrali.pat po Práškových stoupencích pojetím života nepřekračujících meze Seibtových.ACT instrukcí k egoistickému chytračení.pat Zásluhou Hetschových.ACT instrukcí oddělit.pat archivování dublet se celá kolekce zachovala instrukce babičce.addr, jak má.pat nahodit vypadlé pojistky *instrukce v nahození vypadlých pojistek Praha, Seminář formální lingvistiky 38
39 PS Dat apelovat na koho apel komu Nové specifické posuny PS 1 PS 2 vyzvat koho.addr k čemu.pat výzva o co (výzva o podporu / o pomoc) Na její.act výzvy o další podporu.pat a pomoc.pat z řad ostatních lidí nikdo nereagoval. na naši.act výzvu o finanční pomoc.pat reagovaly jen Od hromadného pátrání už o víkendu policie upustila, výzvy o pomoc.pat k možným svědkům.addr pokračují. Instr Gen (v rámci jednoho aktantu) odpovědět na co.pat čím.eff odpověď přejídáním.eff na vše.pat nedostupné, co předvádí reklama; a do této řady patří i odpověď mlčením.eff; Zdá se ti tedy, že odpověď mlčení.eff je příliš nedostatečná a neuspokojivá.; odpověď oddanosti.eff straně, odpověď poslušnosti.eff a velkorysé lásky.eff; Zatím atribut -specval vyplněn: 28 lexikálních jednotek (rámců) Praha, Seminář formální lingvistiky 39
40 Nové specifické posuny Povrchové realizace participantů sloves Nom Gen Dat Ak Loc Instr PS Inf VV Adv Pos Gen Dat Loc Instr PS Inf VV Adv Adj Povrchové realizace participantů substantiv Praha, Seminář formální lingvistiky 40
41 Možnost / nemožnost vyjádření typických forem Absence ACT(2) Zatím u pěti LU; souvisí s nutnou přítomností PAT(2) nebo ADDR(2), aby byl odlišen význam * PROHLÁŠENÍ, PROHLAŠOVÁNÍ [n-vallex-shared-communication.txt] ~ impf: prohlašování pf: prohlášení [blu-n-prohlášení-prohlašování-3] + ACT(7,pos;obl) PAT(2,pos;obl) EFF(7,za+4;obl) -synon: impf: označování; udělování hodnosti někomu pf: označení; udělení hodnosti někomu -example:impf: Proces prohlašování kulturních památek.pat za národní kulturní památky.eff se řídí legislativními pravidly vlády.; Prohlašování nemovitých věcí.pat kulturní památkou.eff; vadí mi jeho.act prohlašování lží.pat za fakta.eff; V kombinaci s EFF(7,za+4) bude genitiv vždy PAT, nikoli ACT. Kombinace PAT(pos) ACT(2) EFF(7,za+4) je negramatická. A samotný genitiv bude vždycky interpretovaný jako jiný význam daného substantiva (prohlášení Petra.ACT). Praha, Seminář formální lingvistiky 41
42 Možnost / nemožnost vyjádření typických forem Vyjádření ACT(7) Všechna substantiva z třídy Communication: 38 lexikálních jednotek (rámců) Dějová substantiva: pouze 6 lexikálních jednotek např. instruktáž, nabídka, urgence, výklad, zákaz Předoperační rehabilitace by měla zahrnovat instruktáž fyzioterapeutem.act před operací. Otevřená nabídka pevného platu.pat firmou.act dnes nebývá tolik obvyklá nebo je neodstranil po jejich.pat urgenci objednatelem.act při předání exemplifikovaný výklad gramatického pravidla.pat učitelem.act; Po zákazu tabákové reklamy.pat Evropskou unií.act se zde celá disciplína bude muset od srpna obejít bez strategických sponzorů Praha, Seminář formální lingvistiky 42
43 Možnost / nemožnost vyjádření typických forem PAT(2,pos) / ADDR(2,pos) PAT(2,pos) / ADDR(2,pos) A nezapomeňte na odměnu! Její.PAT přislíbení před očkováním je vynikající a v praxi osvědčenou motivací. spočívá-li řešení takové situace pouze v upozornění odpovědné osoby a jejím.addr vyzvání, aby zahrádku v uvedený čas uzavřela.pat, lze takový přístup považovat PAT(2) / ADDR(2) Gen Adverb Gen Adnom Celkový podíl zaměstnanců dotazovaných subjektů, které tyto subjekty v době jejich.addr dotazování zaměstnávaly přímo Nevyskytl se: ptaní, otázání se, tázání se, zeptání participant propoziční povahy, nejčastěji PAT(2,PS,aby,zda,jestli,že;obl) diskuse otázek.pat / problémů.pat bezprostředním podnětem přisátí.pat je mechanický kontakt představa, že by se mohli vystavit navždy neodčinitelné výtce zbabělosti.pat odpověď mlčením.eff / mlčení.eff Praha, Seminář formální lingvistiky 43
44 Vidové protějšky verbálních substantiv vyzývání / vyzvání děj: ACT(2,7,pos,ze_strany+2;obl) ADDR(2,pos;obl) PAT(k+3,na+4,inf,aby,ať,cont;obl) abstraktní výsledek děje: pouze vyzvání ACT(2,pos;obl) ADDR(3,k+3;obl) PAT(aby,ať,cont;obl) vyzvání Rusku.ADDR a Německu.ADDR, aby se pokusily.pat vykládání / vyložení (Communication) ACT(2,7,pos;obl) ADDR(3;obl) PAT(2,pos,aby,ať,zda,že,cont;obl) vykládání i vyložení ACT(2,7,pos;obl) ADDR(3;obl) PAT(o+6;obl) EFF(2,že,cont;obl) základová slovesa: vykládat i vyložit verbální substantiva: pouze vykládání; vyložení výklad; *vyložení o čem,??vyložení Petra.ACT výklad Petra.ACT vykládání / vyložení (Providing, pokrýt povrch zevnitř) konkrétum: pf i impf Na starší vrstvu zástavby bezprostředně navazuje konzolové vyložení v podobě dřevěného trámu nebo kamenného krakorce Noel vystoupil na stůl a svýma mozolnatýma nohama poškrábal jeho jemné vykládání Praha, Seminář formální lingvistiky 44
45 Sketch Engine: Tezaurus hledá podobná slova Odlišné významy Substantivum komunikace: Praha, Seminář formální lingvistiky 45
46 Sketch Engine: Tezaurus hledá podobná slova Odlišné významy Substantivum komunikace: Praha, Seminář formální lingvistiky 46
47 Substantivum hovor: Odlišné významy Praha, Seminář formální lingvistiky 47
48 Vallex 3.0: PDT-Vallex navíc např.: ACT(.1) DPHR(do-1[duše.2]) PAT(.3) v-w1111f11 hovořil mu do duše Praha, Seminář formální lingvistiky 48
49 Praha, Seminář formální lingvistiky 49
50 Vyhledávání v korpusech ČNK SYNv4, Araneum KonText, CQL dotazy Word Sketch Automatická syntaktická analýza Praha, Seminář formální lingvistiky 50
51 Vyhledávání v korpusech ČNK SYNv4, Araneum KonText, CQL dotazy Word Sketch Automatická syntaktická analýza Pražské závislostní korpusy PDT3.0, PCEDT2.0, PDTSC PML-TQ Manuální syntaktická analýza Funktory Doplněna hloubkově obligatorní valenční doplnění, která jsou v povrchové struktuře věty vypuštěna Praha, Seminář formální lingvistiky 51
52 Vyhledávání v korpusech Úpravy Word Sketch gramatiky pro potřeby NomVallexu vyhledává i bezpředložkový dativ, bezpředložkový instrumentál, posesiva aj. v budoucnu: vyhledávání nejčastějších kombinací adnominálních forem Analýza dat z pražských závislostních korpusů frekvence kombinací aktantů u jednotlivých sémantických tříd nejčastější kombinace adnominálních forem mluvený vs. psaný komunikát Praha, Seminář formální lingvistiky 52
53 Kvantitativní analýza: Sonda do PDT 3.0 Substantiva, která byla v datech PDT 3.0 rozvita nějakým aktantem povrchově vyjádřený nebo nevyjádřený aktant zanedbává se polysémie substantiv Kombinace aktantů Formy aktantů Typ substantiva Verbální subst. Dějové subst. Communication Exchange Contact Mental action Psych. nouns lemmata Celkem výskyty lemmata výskyty Celkem lemmata výskyty Praha, Seminář formální lingvistiky 53
54 Verbální substantiva: PDT PAT ACT ADDR PAT+ADDR ACT+ADDR ACT+PAT Mluvení Výměna Dotyk Mentální činnost Duševní projevy Praha, Seminář formální lingvistiky 54
55 Dějová substantiva: PDT PAT ACT ADDR PAT+ADDR ACT+ADDR ACT+PAT Mluvení Výměna Dotyk Mentální činnost Duševní projevy Praha, Seminář formální lingvistiky 55
56 Kombinace dvou povrchově vyjádřených aktantů Rozdíly mezi třídami Exchange a Communication převažuje kombinace PAT+ ADDR u třídy Exchange potvrzuje výsledky dřívější sondy do ČNK SYN Verbální substantiva % % ACT+PAT 3 ACT+ADDR 2 PAT+ADDR PAT+EFF 1 PAT+ORIG 0 Dějová substantiva ACT+PAT ACT+ADDR PAT+ADDR PAT+EFF PAT+ORIG Praha, Seminář formální lingvistiky 56
57 Kombinace dvou povrchově vyjádřených aktantů Rozdíly mezi třídami Exchange a Communication převažuje kombinace PAT+ ADDR u třídy Exchange potvrzuje výsledky dřívější sondy do ČNK SYN Verbální substantiva % % ACT+PAT 3 ACT+ADDR 2 PAT+ADDR PAT+EFF 1 PAT+ORIG 0 Dějová substantiva ACT+PAT ACT+ADDR PAT+ADDR PAT+EFF PAT+ORIG Praha, Seminář formální lingvistiky 57
58 Kombinace tří povrchově vyjádřených aktantů Verbální substantiva % % 0,14 0,09 0,12 0,08 0,1 0,07 0,06 0,08 0,05 0,06 0,04 ACT+PAT+ADDR 0,04 0,03 ACT+PAT+EFF 0,02 0,02 0, Dějová substantiva ACT+PAT+ADDR ACT+PAT+EFF Praha, Seminář formální lingvistiky 58
59 Forma vyjádření konatele (Aktora) Gen > Pron pos > Adj pos / Instr > od+gen Forma Instr se u některých tříd vůbec nevyskytuje Verbální substantiva % % Gen Instr Adjpos Pronpos 10 0 od+gen 0 Dějová substantiva Gen Instr Adjpos Pronpos od+gen Praha, Seminář formální lingvistiky 59
60 Kombinace Kombinace forem Všechna verbální substantiva v PDT3.0 Relativní frekvence Příklady Pouze Gen 70 % působení kyslíku, zvyšování ceny Pouze předložková skupina (PS) 9 % srovnávání s okolím, jednání o koupi Posesiva 6 % Clintnovo, naše Gen + PS 3 % měření sil se Švédy Nesklonné substantivum 1,5 % vedení Oilers, rozdělení ČSFR Vedlejší věta 0,8 % prohlášení, že Infinitiv 0,5 % oprávnění zastavit vozidlo Gen + PS + PS < 0,1 % snížení investic z jedné miliardy na 600 milionů Praha, Seminář formální lingvistiky 60
61 Verbální substantiva PCEDT(psaný korpus) vs. PDTSC (mluvený korpus) Mluvený korpus: výrazně více elips valenčních doplnění Oba korpusy: stejné pořadí relativních četností kombinací vyjádřených aktantů PCEDT (psaný) PDTSC (mluvený) Praha, Seminář formální lingvistiky 61
62 Závěr NomVallex: valence verbálních i dějových substantiv zastupujících pět sémantických tříd Communication, Exchange, Contact, Mental action, Psychological nouns Provázanost s Vallexem stejné anotační schéma vyhledávací program Srovnání valence slovesných a substantivních lexikálních jednotek specifické valenční chování substantiv významové posuny Kvantitativní analýza sémantických tříd v PDT korpusech shodné rysy napříč třídami, u verbálních i dějových substantiv rozdílné rysy (rozdílné preference v souvýskytu dvou aktantů) mluvený vs. psaný projev Úpravy Word Sketch gramatiky Praha, Seminář formální lingvistiky 62
63 Literatura Čermáková, A. (2009). Valence českých substantiv. Praha: Lidové noviny. ISBN Kolářová, V. (2010). Valence deverbativních substantiv v češtině (na materiálu substantiv s dativní valencí). Praha: Karolinum. Kolářová, V. (2014). Special valency behavior of Czech deverbal nouns. In O. Spevak (Ed.) Noun Valency, Amsterdam: John Benjamins, pp Kolářová, V. (2014): Preference v souvýskytu aktantů u českých substantiv mluvení. Korpus gramatika axiologie, Vol. 5, No. 10. Hradec Králové: Gaudeamus, pp Kuryłowicz, J. (1936). Dérivation lexicale et dérivation syntaxique. Bulletin de la Société de Linguistique de Paris. 1936, 37, pp Lopatková, M.; Kettnerová, V.; Bejček, E.; Vernerová, A. and Žabokrtský, Z. (2015). VALLEX Valenční slovník českých sloves. Charles University in Prague, [online] Panevová, J. (1974 and 1975). On verbal frames in functional generative description. Prague Bulletin of Mathematical Linguistics. Part I: 1974, 22, pp Part II: 1975, 23, pp Panevová, J. (2000). Poznámky k valenci podstatných jmen. In Z. Hladká, P. Karlík (Ed.) Čeština univerzália a specifika 2. Brno: Vydavatelství MU, pp ISBN Przepiórkowski, A. et al. (2014). Walenty: Towards a comprehensive valence dictionary of Polish. In N. Calzolari, K. Choukri, T. Declerck, H. Loftsson, B. Maegaard, J. Mariani, A. Moreno, J. Odijk and S. Piperidis (Eds) Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC 2014), Reykjavík, Iceland: ELRA, pp Svozilová, N.; Prouzová, H. and Jirsová, A. (2005). Slovník slovesných, substantivních a adjektivních vazeb a spojení. Praha: Academia. Praha, Seminář formální lingvistiky 63
Valence českých deverbativních substantiv reprezentujících vybrané sémantické třídy
Valence českých deverbativních substantiv reprezentujících vybrané sémantické třídy Veronika Kolářová Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze 1
VALENČNÍ SLOVNÍK ČESKÝCH SUBSTANTIV: VÝCHODISKA A CÍLE
VALENČNÍ SLOVNÍK ČESKÝCH SUBSTANTIV: VÝCHODISKA A CÍLE Veronika Kolářová, Jana Klímová, Anna Vernerová Ústav formální a aplikované lingvistiky MFF UK Praha 22. 4. 2016 Slovanská lexikografie počátkem 21.
Vyjádření propozice pomocí verbálních substantiv v korpusech psané a mluvené češtiny
Vyjádření propozice pomocí verbálních substantiv v korpusech psané a mluvené češtiny Veronika Kolářová, Jan Kolář, Marie Mikulová Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita
Preference v souvýskytu aktantů u českých substantiv mluvení
Preference v souvýskytu aktantů u českých substantiv mluvení Ústav formální a aplikované lingvistiky MFF UK, Praha kolarova@ufal.mff.cuni.cz Preferences in co-occurrence of participants modifying Czech
Valence vybraných typů deverbativních substantiv ve valenčním slovníku PDT-Vallex. ÚFAL Technical Report TR-2014-56 ISSN 1214-5521
M A T E M A T I C K O - F Y Z I K Á L N Í F A K U L T A P R A H A Valence vybraných typů deverbativních substantiv ve valenčním slovníku PDT-Vallex VERONIKA KOLÁŘOVÁ ÚFAL Technical Report TR-2014-56 ISSN
Jarmila Panevová (Praha) K valenci substantiv (s ohledem na jejich derivaci)
Jarmila Panevová (Praha) K valenci substantiv (s ohledem na jejich derivaci) Abstrakt: V příspěvku se snažíme pro substantivní valenci ověřit platnost dvou základních hypotéz, jichž užíváme pro zjišťování
Towards a Corpus-based Valency Lexicon of Czech Nouns
Towards a Corpus-based Valency Lexicon of Czech Nouns Jana Klímová, Veronika Kolářová, Anna Vernerová Institute of Formal and Applied Linguistics Faculty of Mathematics and Physics Charles University in
ČASOPIS PRO MODERNÍ FILOLOGII 99, 2017, Č. 1, S
ČASOPIS PRO MODERNÍ FILOLOGII 99, 2017, Č. 1, S. 131 146 MARKÉTA LOPATKOVÁ A KOL.: VALENČNÍ SLOVNÍK ČESKÝCH SLOVES VALLEX Druhé vydání, přepracované a rozšířené Praha: Karolinum, 2016, 698 stran ISBN 978-80-246-3542-2
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech Kateřina Veselovská ÚFAL MFF UK veselovska@ufal.mff.cuni.cz
LEXIKÁLNĚ- -SÉMANTICKÉ KONVERZE VE VALENČNÍM SLOVNÍKU
LEXIKÁLNĚ- -SÉMANTICKÉ KONVERZE VE VALENČNÍM SLOVNÍKU VÁCLAVA KETTNEROVÁ KAROLINUM Lexikálně-sémantické konverze ve valenčním slovníku Mgr. Václava Kettnerová, Ph.D. Recenzovali: prof. PhDr. Petr Karlík,
Kolísání rodu substantiv
Kolísání rodu substantiv Alena Poncarová alena.poncarova@gmail.com Ţďárek duben 2012 Ţďárek Proč se zabývám jmenným rodem Jmenný rod jako takový Kolísání v širokém slova smyslu Některé problémy bádání
zejména synonymie a antonymie, s odpovídajícím popisem gramatických vlastností
Nová cesta k modernímu jednojazyčnému výkladovému slovníku současné češtiny: koncepční poznámky ke struktuře dat v novém DWS Pavla Kochová, Zdeňka Opavská 1. Úvod V oddělení současné lexikologie a lexikografie
PDT-Vallex: trochu jiný valenční slovník
PDT-Vallex: trochu jiný valenční slovník Zdeňka Urešová uresova@ufal.mff.cuni.cz Univerzita Karlova v Praze Ústav formální a aplikované lingvistiky Malostranské nám. 25 11800 Praha 1 Česká republika Abstract
Korpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105
Korpusová lingvistika 2 Mgr. Dana Hlaváčková, Ph.D. CJBB105 Vývoj korpusové lingvistiky raná korpusová lingvistika, počítačová lexikografie, frekvenční studie (90. léta 19. st. 50. léta 20. st.) předěl
Korpusová lingvistika a počítačová lexikografie. Od 60. let 20. st.
Korpusová lingvistika a počítačová Od 60. let 20. st. Raná korpusová lingvistika (konec 19. st 50. léta 20. st., Early corpus linguistics) strukturalistická tradice, americký deskriptivismus, metody založené
Výňatek (obsah a teoretický úvod) z knihy
Výňatek (obsah a teoretický úvod) z knihy Markéta Lopatková, Zdeněk Žabokrtský, Václava Kettnerová a kol.: Valenční slovník českých sloves. Univerzita Karlova v Praze, Nakladatelství Karolinum, Praha,
VALENCE DEVERBATIVNÍCH SUBSTANTIV V ČEŠTINĚ
VALENCE DEVERBATIVNÍCH SUBSTANTIV V ČEŠTINĚ (na materiálu substantiv s dativní valencí) Veronika Kolářová Univerzita Karlova v Praze Nakladatelství Karolinum praha 2010 Recenzovali: doc. RNDr. Vladimír
Valence vybraných skupin sloves (k některým slovesům dandi a. recipiendi) *
Markéta Lopatková, Jarmila Panevová (MFF UK Praha) Valence vybraných skupin sloves (k některým slovesům dandi a recipiendi) * 1. Motivace K výběru sloves, jejichž valenční analýzu podanou v rámci funkčního
Popis morfologických značek poziční systém
Popis morfologických značek poziční systém Jan Hajič Ústav formální a aplikované lingvistiky MFF UK Morfologická analýza a syntéza Morfologické značky jsou součástí výsledku (výstupem) morfologické analýzy,
WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY
WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY Datum konání: 11. dubna 2014 Místo konání: Filozofická fakulta Masarykovy univerzity (učebna G13) Název přednášky: Přednášející: Webové korpusy Aranea
VALENČNÍ SLOVNÍK PRAŽSKÉHO ZÁVISLOSTNÍHO KORPUSU PDT-Vallex. Zdeňka Urešová
VALENČNÍ SLOVNÍK PRAŽSKÉHO ZÁVISLOSTNÍHO KORPUSU PDT-Vallex Zdeňka Urešová STUDIES IN COMPUTATIONAL AND THEORETICAL LINGUISTICS Zdeňka Urešová VALENČNÍ SLOVNÍK PRAŽSKÉHO ZÁVISLOSTNÍHO KORPUSU PDT-Vallex
SYNTAX LS Úvod
SYNTAX LS 2017 Úvod Co očekáváte od předmětu? viz sylabus požadavky Literatura Nový encyklopedický slovník češtiny https://www.czechency.org/ Panevová a kol. (2014) Mluvnice současné češtiny 2. http://www.cupress.cuni.cz/ink2_ext/index.jsp?
2 Lexikální jednotka. 2.1 Obecné kategorie
2 Lexikální jednotka 2.1 Obecné kategorie Pojmy vyjádřené lexikálními jednotkami patří k těmto obecným kategoriím: a) Konkrétní entity (nositelé vlastností a dějů) b) Abstraktní entity c) Individuální
Možné alternace ve VALLEXu
Možné alternace ve VALLEXu Úvod Snažila jsem se zachytit a stručně popsat jednotlivé možné typy alternací. Projevují se změnami v rámci ( funktory, obsazení funktorů, ) při popsatelném pevně daném posunu
O SLOVOSLEDU Z KOMUNIKAČNÍHO POHLEDU. Kateřina Rysová
O SLOVOSLEDU Z KOMUNIKAČNÍHO POHLEDU Kateřina Rysová STUDIES IN COMPUTATIONAL AND THEORETICAL LINGUISTICS Kateřina Rysová O SLOVOSLEDU Z KOMUNIKAČNÍHO POHLEDU Published by Institute of Formal and Applied
O SLOVOSLEDU Z KOMUNIKAČNÍHO POHLEDU. Kateřina Rysová
O SLOVOSLEDU Z KOMUNIKAČNÍHO POHLEDU Kateřina Rysová STUDIES IN COMPUTATIONAL AND THEORETICAL LINGUISTICS Kateřina Rysová O SLOVOSLEDU Z KOMUNIKAČNÍHO POHLEDU Published by Institute of Formal and Applied
Testování konzistence a úplnosti valenčního slovníku českých sloves
Testování konzistence a úplnosti valenčního slovníku českých sloves Markéta Lopatková and Zdeněk Žabokrtský Center for Computational Linguistics, MFF UK, Prague {lopatkova,zabokrtsky}@ckl.mff.cuni.cz Abstrakt
KORPUSOVÝ WORKSHOP. Václav Cvrček, Lucie Chlumská. 13. 2. 2013 Univerzita Karlova v Praze VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT!
KORPUSOVÝ WORKSHOP VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT! Václav Cvrček, Lucie Chlumská 13. 2. 2013 Univerzita Karlova v Praze O (Ú)ČNK Ústav Českého národního korpusu, založen v roce
Vyučovací předmět: Český jazyk a literatura Ročník: 6. Jazyková výchova
Vyučovací předmět: Český jazyk a literatura Ročník: 6. Vzdělávací obsah Očekávané výstupy z RVP ZV Školní výstupy Učivo Přesahy a vazby, průřezová témata rozlišuje spisovný jazyk, nářečí a obecnou češtinu
OBSAH. Předmluva (Libuše Dušková) DÍL I. Rozbor fonologický
OBSAH Předmluva (Libuše Dušková) DÍL I. Rozbor fonologický Úvod Rozdělení jazykového rozboru Poměr fonologie k fonetice. Dějiny bádání Fonémy a varianty Monofonémové hodnocení hláskových komplexů Dvoufonémové
ve strojovém překladu
Jaká data se používají ve strojovém překladu Ondřej Bojar bojar@ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky MFF UK ELRC Training Workshop, 15. prosinec 2015 1/39 Osnova Typy dat ve strojovém
DeriNet: Lexikální databáze českých derivátů
DeriNet: Lexikální databáze českých derivátů Magda Ševčíková, Zdeněk Žabokrtský {sevcikova,zabokrtsky}@ufal.mff.cuni.cz Univerzita Karlova v Praze Matematicko-fyzikální fakulta Ústav formální a aplikované
Valence a Pražský závislostní korpus (PDT)
SNK, JÚ ĽŠ SAV, Bratislava, 6. 10. 2003 Jarmila Panevová, Markéta Lopatková panevova@ufal.mff.cuni.cz lopatkova@ckl.mff.cuni.cz Valence a Pražský závislostní korpus (PDT) 1. Teorie valence v teoretickém
Ročník: 5. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby
Ročník: 5. Časová dotace: 7 hodin týdně Komunikační a slohová Zážitkové čtení a naslouchání klíčová slova vyhledávací čtení aktivní naslouchání se záznamem slyšeného Žák při hlasitém čtení vhodně využívá
UNIVERZITA KARLOVA FILOZOFICKÁ FAKULTA FUNKCE ADVERBÁLNÍHO DATIVU V HLOUBKOVÉ A POVRCHOVÉ STAVBĚ ČESKÉ VĚTY
UNIVERZITA KARLOVA FILOZOFICKÁ FAKULTA ÚSTAV ČESKÉHO JAZYKA A TEORIE KOMUNIKACE Magda Razímová FUNKCE ADVERBÁLNÍHO DATIVU V HLOUBKOVÉ A POVRCHOVÉ STAVBĚ ČESKÉ VĚTY Diplomová práce Praha 2004 Vedoucí diplomové
STUDIJNÍ OPORA K DISCIPLÍNĚ KORPUSOVÁ LINGVISTIKA. Katedra českého jazyka a literatury Pedagogické fakulty Univerzity Palackého
STUDIJNÍ OPORA K DISCIPLÍNĚ KORPUSOVÁ LINGVISTIKA Katedra českého jazyka a literatury Pedagogické fakulty Univerzity Palackého Počet kreditů: 1 Typ předmětu: volitelný Způsob zakončení: zápočet Garant
Retrográdní slovníky = inverzní
Retrográdní slovníky = inverzní Přinášejí slovní zásobu (nebo její část) určitého jazyka v obráceném abecedním řazení (tj. od konce slova, a tergo) Jsou především zdrojem poznání slovotvorných typů a jejich
PŘEDMLUVA VÝKLADOVÁ ČÁST
PŘEDMLUVA VÝKLADOVÁ ČÁST 11 SYNTAX LATINSKÝCH VEDLEJŠÍCH VĚT 12 ÚVOD ÚVOD V lingvistice se od druhé poloviny 20. století věnuje syntaxi velká pozornost. Mezi nejvýznamnější teoretické přístupy patří transformačně
E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO
Seznam výukových materiálů III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Tematická oblast: Předmět: Vytvořil: Rozšiřování a upevňování slovní zásoby a gramatiky Ruský jazyk Helena Malášková 01
Zápis morfologických dat návrh řešení pro lexikální databázi LEXIKON 21 1
f.voborská/41-46/6 6.2.2009 21:56 Stránka 41 Zápis morfologických dat návrh řešení pro lexikální databázi LEXIKON 21 1 Ústav pro jazyk český AV ČR, v. v. i. Tools for Inputting Morphological Data A Proposal
Automatická post-editace výstupů frázového strojového překladu (Depfix)
Rudolf Rosa diplomová práce Automatická post-editace výstupů frázového strojového překladu (Depfix) Automatic post-editing of phrase-based machine translation outputs Motivační příklad Zdroj (WMT 2010):
Automatické rozpoznávání substantivního dativu při morfologické disambiguaci českých textů 1
Automatické rozpoznávání substantivního dativu při morfologické disambiguaci českých textů 1 Vladimír Petkevič Ústav teoretické a komputační lingvistiky FFUK Vladimir.Petkevic@ff.cuni.cz ABSTRACT: The
Perfektym v současné cestine
Perfektym v současné cestine Korpusová studie jeho gramatikalizace na bázi Českého národního korpusu Mira Načeva-Marvanová NAKLADATELSTVÍ LIDOVÉ NOVINY Ústav Českého národního korpusu Obsah PŘEDMLUVA (František
VALENCE DEVERBATIVNÍCH SUBSTANTIV V ČEŠTINĚ
VALENCE DEVERBATIVNÍCH SUBSTANTIV V ČEŠTINĚ VERONIKA KOLÁŘOVÁ Disertační práce Univerzita Karlova v Praze Matematicko-fyzikální fakulta Ústav formální a aplikované lingvistiky Praha, 2005 Disertační práce
Tabulace učebního plánu
Tabulace učebního plánu Vzdělávací obsah pro vyučovací předmět: LATINA Ročník: KVINTA a I. ROČNÍK Tematická oblast Historický úvod do latinského jazyka Co je latina a odkud pochází; jakým prošla vývojem
Příspěvky k české morfologii
Příspěvky k české morfologii Miroslav Komárek Obsah 5 Obsah ÚVODEM.! 11 I. SYSTÉM AUTOSÉMANTICKÝCH SLOVNÍCH DRUHŮ V SPISOVNÉ ČEŠTINĚ 13 0. Vstupní poznámka 13 1. Kritéria klasifikace slovních druhů 13
3.4.1. Tabulace učebního plánu
3.4.1. Tabulace učebního plánu Vzdělávací obsah pro vyučovací předmět : LATINA Ročník: KVINTA a I.ROČNÍK Učebnice: Gason, J., Lambert, A., Invitation au Latin 4e :D Enée à César, Magnard, Paris, 1990 Tématická
Reálné gymnázium a základní škola města Prostějova Školní vzdělávací program pro ZV Ruku v ruce
1 JAZYK A JAZYKOVÁ KOMUNIKACE UČEBNÍ OSNOVY 1. 2 Cvičení z českého jazyka Cvičení z českého jazyka 7. ročník 1 hodina 8. ročník 1 hodina 9. ročník 1 hodina Charakteristika Žáci si tento předmět vybírají
Deadjektivní deriváty v češtině jako deriváty syntaktické vs. lexikální
Deadjektivní deriváty v češtině jako deriváty syntaktické vs. lexikální Magda Ševčíková Ústav formální a aplikované lingvistiky MFF UK sevcikova@ufal.mff.cuni.cz ABSTRACT: Deadjectival derivates are a
1 Substantiva. 2 Adjektiva. Obsah. Lekce Obsah Cvičení
Obsah Úvod. Substantiva. Adjektiva. Personalia, posesiva. Demonstrativa. Interogativa, relativa 0. Indefinita, negativa. Numeralia 0. Verba prézentní tvary. Verba préteritum 0. Verba aspekt. Verba futurum.
Olympiáda v českém jazyce 45. ročník, 2018/2019
Národní institut pro další vzdělávání MŠMT Senovážné náměstí 25, 110 00 Praha 1 Olympiáda v českém jazyce 45. ročník, 2018/2019 Okresní kolo zadání I. kategorie přidělené soutěžní číslo body gramatika
Použití této techniky se v tezaurech nedoporučuje.
3 Sousloví 3.1 Obecně Obecně se má za to, že lexikální jednotky mají vyjadřovat jednoduché popř. jednolité pojmy a že sousloví je třeba rozložit na jednodušší prvky s výjimkou těch případů, kdy by rozklad
SLOVNÍKOVÁ INFORMACE A JEJÍ POUŽITÍ V GRAMATICE (NA PŘÍKLADU ČESKÉHO SLOVESA)**
ISSN 0350 185x, LXIX (2013) UDK: 811.162.3 36 ID: 199262988 DOI: 10.2298/JFI1369075P Примљено: 1. марта 2013. Прихваћено: 5. марта 2013. Оригинални научни рад JARMILA PANEVOVÁ* Karlova univerzita v Praze
ZPRÁVA O PRŮBĚHU PRACÍ na programovém projektu Informační společnost 2005 1ET101120413
Národní 3, 117 20 Praha 1 List PT1 ZPRÁVA O PRŮBĚHU PRACÍ na programovém projektu Informační společnost Rok Identifikační kód projektu 2005 1ET101120413 01 Řešitel projektu Jméno: Mgr. Barbora Vidová Hladká,
D 2. - ), ; ( ), 2.1 (1971, 1975, 1981), Z
VĚTNÉ STRUKTURY 2. Termínem větné (syntaktické) struktury označujeme to syntaktickosémantické jádro vět, které je bezprostředně dominováno a konstituováno syntaktickými a sémantickými vlastnostmi predikátů
Modul NE2-1. Osnova: Arbeitsbuch. Ismaning: Max Hueber, 2002. 504 s. ISBN 3-19-011601-6
Německý jazyk začátečnický V rámci Inovace studijního programu PIS byly u studijního oboru německý jazyk začátečnický (NE2) vymezeny základní aspekty ve výuce tak, aby po ukončení studia byli studenti
0. Úvod. 1. Syntaktické značkování textu
Systém pro syntaktické značkování velkých textových korpusů 1 Tomáš Jelínek Ústav teoretické a komputační lingvistiky Filozofické fakulty Karlovy univerzity Abstract Syntactic annotation of corpora is
Automatická post-editace výstupů frázového strojového překladu (Depfix)
Rudolf Rosa diplomová práce Automatická post-editace výstupů frázového strojového překladu (Depfix) Automatic post-editing of phrase-based machine translation outputs Motivační příklad Zdroj: All the winners
Depfix: Jak dělat strojový překlad lépe než Google Translate
Rudolf Rosa rur@nikdeeu http://ufalmffcunicz/rudolf-rosa Depfix: Jak dělat strojový překlad lépe než Google Translate Univerzita Karlova v Praze Matematicko-fyzikální fakulta Ústav formální a aplikované
Liší se mluvené a psané texty ve valenci? 1
Liší se mluvené a psané texty ve valenci? 1 Marie Mikulová Jan Štěpánek Zdeňka Urešová Ústav formální a aplikované lingvistiky, MFF UK Praha {mikulova, stepanek, uresova}@ufal.mff.cuni.cz Valency in spoken
OBSAH 1 TVOŘENÍ SLOV SKLÁDÁNÍM Obecný výklad Rozsah čisté kompozice a komplexních postupů u složených
OBSAH Obsah 2 Předmluva 9 1 TVOŘENÍ SLOV SKLÁDÁNÍM 12 1.0 Obecný úvod 12 1.1 Přehled nejdůležitější odborné literatury o tvoření slov skládáním v češtiné 16 2 SLOŽENÁ SUBSTANTIVA 20 2.0 Obecný výklad 20
Univerzita Karlova v Praze, Nakladatelství Karolinum, 2015 Robert Adam, 2015
Morfologie Příručka k povinnému předmětu bakalářského studia oboru ČJL Robert Adam Grafická úprava Jan Šerých Sazba DTP Nakladatelství Karolinum Vydání první Univerzita Karlova v Praze, Nakladatelství
Ústav bohemistických studií Bohemistika pro cizince tříletý bakalářský studijní program
Ústav bohemistických studií Bohemistika pro cizince tříletý bakalářský studijní program https://ubs.ff.cuni.cz/cs/ Charakteristika studijního programu SP vychází zvl. z vědních oborů: lingvistika, literatura,
Valenční rámce substantiv v češtině na základě korpusových dat
Univerzita Karlova v Praze, Filosofická fakulta Ústav teoretické a komputační lingvistiky Valenční rámce substantiv v češtině na základě korpusových dat Valency Frames of Czech Nouns: Corpus-driven Study
Strukturovaný životopis
Strukturovaný životopis Mgr. Magdaléna Rysová Osobní informace E-mail: magdalena.rysova@post.cz WWW: https://ufal.mff.cuni.cz/magdalena-rysova Vzdělání od 2012 FF UK v Praze: doktorské studium, obor Český
Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA
září Žák porovnává významy slov, zvláště slova podobného nebo stejného významu a slova vícevýznamová. Žák dokáže rozlišit mluvnické kategorie podstatných jmen (pád, číslo, rod), rozliší větu jednoduchou
Čím může bohemistice přispět současná počítačová lingvistika?
Jarmila Panevová (Univerzita Karlova, Praha) Čím může bohemistice přispět současná počítačová lingvistika? I. Po několik destiletí (od 2. poloviny 20. století) se mohlo zdát, že počítačová a formální lingvistika
Výzkum slovesné valence ve slovanských zemích. Karolína Skwarska Elżbieta Kaczmarska (eds.)
Výzkum slovesné valence ve slovanských zemích Karolína Skwarska Elżbieta Kaczmarska (eds.) Slovanský ústav AV ČR, v. v. i. Praha 2016 3 Vědečtí recenzenti: prof. Dr. Danuta Rytel-Schwarz Natalia Kotsyba,
VALENCE SLOVES V PRAŽSKÉM ZÁVISLOSTNÍM KORPUSU. Zdeňka Urešová
VALENCE SLOVES V PRAŽSKÉM ZÁVISLOSTNÍM KORPUSU Zdeňka Urešová STUDIES IN COMPUTATIONAL AND THEORETICAL LINGUISTICS Zdeňka Urešová VALENCE SLOVES V PRAŽSKÉM ZÁVISLOSTNÍM KORPUSU Published by Institute of
Další cizí jazyk Německý jazyk /čtyřleté gymnázium a vyšší stupeň osmiletého gymnázia/
Další cizí jazyk Německý jazyk /čtyřleté gymnázium a vyšší stupeň osmiletého gymnázia/ CHARAKTERISTIKA VYUČOVACÍHO PŘEDMĚTU OBSAHOVÉ VYMEZENÍ Vyučovací předmět pokrývá vzdělávací oblast Jazyk a jazyková
2. Korpusový portál a volně dostupné nástroje
1. Něco málo o jazykových korpusech co to je a jak se to používá 2. Korpusový portál a volně dostupné nástroje webový portál www.korpus.cz 3. Korpusový nástroj SyD porovnání dvou a více slov z hlediska
Učebnice, cvičebnice, CD-Rom, počítačová učebna, dataprojektor, interaktivní tabule, mapy anglicky mluvících zemí
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Anglický jazyk Jazyk a jazyková komunikace 1. ročník 4 hodiny týdně Učebnice, cvičebnice, CD-Rom, počítačová učebna, dataprojektor, interaktivní tabule, mapy
Ročník: 4. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby
Ročník: 4. Časová dotace: 7 hodin týdně Komunikační a slohová Čtení a naslouchání čtení jako zdroj informací aktivní naslouchání s otázkami Žák čte s porozuměním přiměřeně náročné texty potichu i nahlas.
Jak lze v korpusech hledat doklady pro výzkum morfologie?
Seminář cjbb75 1. 4. 2015 Jak lze v korpusech hledat doklady pro výzkum morfologie? Vyhledávání podle morfologické značky problém spolehlivosti desambiguace Vyhledejte v korpusu SYN2010 všechny vokativy
Prezentace učiva o současné češtině ve školních učebnicích Gabriela Lefenda
Prezentace učiva o současné češtině ve školních učebnicích Gabriela Lefenda KATEDRA ČESKÉHO JAZYKA A LITERATURY S DIDAKTIKOU, PdF OU Sledované učebnice: Český jazyk učebnice pro základní školy (2. 5. ročník),
Lexikální síť DeriNet: elektronický zdroj pro výzkum derivace v češtině 1
Magda Ševčíková Zdeněk Žabokrtský Jonáš Vidra Milan Straka ČASOPIS PRO MODERNÍ FILOLOGII 98, 2016, Č. 1, S. 62 76 Lexikální síť DeriNet: elektronický zdroj pro výzkum derivace v češtině 1 Magda Ševčíková
Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus
Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus David Mareček obhajoba diplomové práce 8. 9. 2008 Motivace Na t-rovině jsou si jazyky podobnější alignment by zde měl být
Moravské gymnázium Brno s.r.o. Hana Blaudeová. Ročník 2. Datum tvorby Anotace. -prezentace určena pro učitele
Číslo projektu Název školy Autor Tematická oblast CZ.1.07/1.5.00/34.0743 Moravské gymnázium Brno s.r.o. Hana Blaudeová Český jazyk Ročník 2. Datum tvorby 05.05.2013 Anotace -prezentace určena pro učitele
Dataprojektor, kodifikační příručky
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Český jazyk (CEJ) Jazyková výchova Prima 2 hodiny týdně Dataprojektor, kodifikační příručky Slovní druhy Objasní motivaci pojmenování slovních druhů Vysvětlí
Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Anglický jazyk Ročník: 5. Průřezová témata Mezipředmětové vztahy.
Ročník: 5. OSV - rozvoj individuálních dovedností pro kooperaci (seberegulace v situaci nesouhlasu, odporu apod., dovednost odstoupit od vlastního nápadu, dovednost navazovat na druhé a rozvíjet vlastní
SADA VY_32_INOVACE_CJ1
SADA VY_32_INOVACE_CJ1 Přehled anotačních tabulek k dvaceti výukovým materiálům vytvořených Mgr. Bronislavou Zezulovou a Mgr. Šárkou Adamcovou. Kontakt na tvůrce těchto DUM: zezulova@szesro.cz a adamcova@szesro.cz
PLIN041 Vývoj počítačové lingvistiky Algebraická lingvistika. Mgr. Dana Hlaváčková, Ph.D. od 2. pol. 50. let 20. st.
PLIN041 Vývoj počítačové lingvistiky Algebraická lingvistika Mgr. Dana Hlaváčková, Ph.D. od 2. pol. 50. let 20. st. Algebraická lingvistika matematika algebra logika formální logika logická analýza jazyka
Vzdělávací obsah vyučovacího předmětu
Vzdělávací obsah vyučovacího předmětu Český jazyk a literatura 4. ročník Zpracovala: Mgr. Helena Ryčlová Komunikační a slohová výchova čte s porozuměním přiměřeně náročné texty potichu i nahlas čte s porozuměním
V této kapitole jsou popsány hlavní vlastnosti anotačního schématu spolu s důvody, proč byly zavedeny.
Syntakticky anotovaný korpus českých textů Milena Hnátková, Petr Jäger, Tomáš Jelínek, Vladimír Petkevič, Alexandr Rosen, Hana Skoumalová Ústav teoretické a komputační lingvistiky, Filozofická fakulta
Ontologie. Otakar Trunda
Ontologie Otakar Trunda Definice Mnoho různých definic: Formální specifikace sdílené konceptualizace Hierarchicky strukturovaná množina termínů popisujících určitou věcnou oblast Strukturovaná slovní zásoba
Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA
Žák porovnává významy slov, zvláště slova podobného nebo stejného významu a slova vícevýznamová O jazyce Opakování učiva 3. ročníku Národní jazyk Naše vlast a národní jazyk Nauka o slově Slova a pojmy,
Výukový plán. Tematický okruh č. 1 - odborné jazykové vzdělávání pracovníků chemického průmyslu - odborná terminologie - chemie
Výukový plán Tematický okruh č. 1 - odborné jazykové vzdělávání pracovníků chemického průmyslu - odborná terminologie - chemie Intenzita kurzu: 6x45 minut denně Počet hodin kurzu (45min): 50 hodin Použité
7. ročník. Český jazyk a literatura. Komunikační a slohová výchova. Vypravování uspořádání dějových prvků
list 1 / 8 Čj časová dotace: 4 hod / týden Český jazyk a literatura 7. ročník (ČJL 9 1 09) sestaví vypravování v časové posloupnosti s využitím názorných jazykových prostředků sestaví vypravování s využitím
Pseudodeminutiva v češtině
Pseudodeminutiva v češtině Jana Bílková Pedagogická fakulta, Univerzita Hradec Králové jana.bilkova@uhk.cz Pseudodiminutives in Czech ABSTRACT: The system of Czech diminutive nouns, with its complex formal-semantic
Dataprojektor, jazykové příručky, pracovní listy
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Tvarosloví *) Český jazyk (CEJ) Jazyková výchova Sekunda 2 hodiny týdně Dataprojektor, jazykové příručky, pracovní listy Určuje slovní druhy, své tvrzení vždy
OJ305 TYPOLOGIE JAZYKŮ z pohledu syntaxe
OJ305 TYPOLOGIE JAZYKŮ z pohledu syntaxe Syntaktická typologie co je to slovosled? co je to syntax? slovosled = pořadí větných členů ve větě syntax = slovosled, tedy pořadí větných členů, vztahy mezi nimi
4.9.2. Příprava na Cambridge English
4.9.2. Příprava na Cambridge English Seminář je určen pro pokročilé žáky anglického jazyka, kteří se chtějí systematicky připravovat ke zkoušce k získání nejrozšířenějšího mezinárodně uznávaného certifikátu
ANOTACE NA TEKTOGRAMATICKÉ ROVINĚ. DODATKY K ANOTÁTORSKÉ PŘÍRUČCE (S OHLEDEM NA ANOTOVÁNÍ PDTSC A PCEDT) ÚFAL Technical Report TR
M A T E M A T I C K O - F Y Z I K Á L N Í F A K U L T A P R A H A ANOTACE NA TEKTOGRAMATICKÉ ROVINĚ. DODATKY K ANOTÁTORSKÉ PŘÍRUČCE (S OHLEDEM NA ANOTOVÁNÍ PDTSC A PCEDT) MARIE MIKULOVÁ ÚFAL Technical
Kam s ní? O interpunkční čárce v souvětí Jana Svobodová
Kam s ní? O interpunkční čárce v souvětí Jana Svobodová KATEDRA ČESKÉHO JAZYKA A LITERATURY S DIDAKTIKOU, PdF OU Teoreticky o čárce v souvětí Bylo by asi výhodné, kdyby se psaní čárky jako interpunkčního
Může být další sbírka fyzikálních úloh pro ZŠ něčím nová?
Může být další sbírka fyzikálních úloh pro ZŠ něčím nová? VOJTĚCH ŽÁK, VĚRA KOUDELKOVÁ, STANISLAV GOTTWALD Katedra didaktiky fyziky, Matematicko-fyzikální fakulta Univerzity Karlovy Příspěvek seznamuje
ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE
ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE Mgr. Barbora Štindlová, Ph. D., Mgr. Veronika Čurdová, Mgr. Petra Klimešová, Mgr. Eva Levorová ÚJOP UK, Praha Práce s chybou, Poděbrady
Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti
Prima jednoduše mluví o sobě Slovní zásoba: elementární slovní 1 B/ 26, 27, 29, 30 tvoří jednoduché otázky a aktivně je používá zásoba pro zvolené tematické okruhy odpovídá na jednoduché otázky obsahující
HOMONYMIE PŘEDLOŽKOVÝCH SKUPIN A MOŽNOST JEJICH AUTOMATICKÉHO ZPRACOVÁNÍ
Matematicko-fyzikální fakulta Univerzity Karlovy HOMONYMIE PŘEDLOŽKOVÝCH SKUPIN A MOŽNOST JEJICH AUTOMATICKÉHO ZPRACOVÁNÍ Markéta Straňáková Disertační práce Ústav formální a aplikované lingvistiky Praha,
obecná lingvistika LING Ústav obecné lingvistiky Filozofická fakulta Univerzity Karlovy
LING Ústav obecné lingvistiky Filozofická fakulta Univerzity Karlovy obecná lingvistika Den otevřených dveří 11. ledna 2014 15 hodin, nám. Jana Palacha 2, míst. 104 LING oddělení lingvistiky Filozofická
SSOS_CJL_5.13. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Číslo a název projektu Číslo a název šablony
Číslo a název projektu Číslo a název šablony DUM číslo a název CZ.1.07/1.5.00/34.0378 Zefektivnění výuky prostřednictvím ICT technologií III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT SSOS_CJL_5.13