Syntaktická rovina a syntaktické funkce

Podobné dokumenty
VĚTNÉ ČLENY. Mgr. Jiří Ondra Procvičení základních pojmů a kategorií z oblasti české skladby. Zdokonalování jazykových vědomostí a dovedností

Anotace na analytické rovině

0. Úvod. 1. Syntaktické značkování textu

SSOS_CJL_5.13. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Číslo a název projektu Číslo a název šablony

Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech

VĚTNÉ ČLENY - PODMĚT A PŘÍSUDEK

Syntaktická proměna Českého akademického korpusu. The syntactic transformation of the Czech Academic Corpus

SADA VY_32_INOVACE_CJ1

Ročník Autor: Mgr. Vladimíra Barboříková

VĚTNÁ SKLADBA Mgr. Soňa Bečičková

Program pro automatickou opravu stochastické syntaktické anotace (analytická rovina PDT)

Dataprojektor, jazykové příručky, pracovní listy

Jméno autora: Mgr. Věra Kocmanová Datum vytvoření: Číslo DUMu: VY_12_INOVACE _08_CJL_NP2

Přísudek. Vytvořeno dne: ve větě

Popis morfologických značek poziční systém

Pražský závislostní korpus jako elektronická cvičebnice češtiny

Automatická post-editace výstupů frázového strojového překladu (Depfix)

Počítačová lingvistika v praxi Pavel Ševeček, Tomáš Pavelek

15. Věta jednoduchá Vypracovala: Martina Miškeříková, červenec 2013

V této kapitole jsou popsány hlavní vlastnosti anotačního schématu spolu s důvody, proč byly zavedeny.

Gramatické závislosti vs. koordinace z pohledu redukční analýzy

SLOVESA (VERBA) Slovesa (verba) Vytvořeno dne: Metodický popis anotace:

Větné členy. Základ věty tvoří základní větné členy, jejich spojení nazýváme základní skladebná dvojice. Jsou to podmět a přísudek.

TVAROSLOVÍ Mgr. Soňa Bečičková

Jazyk a jazyková komunikace 2. ročník a sexta

Úvod do logiky (PL): analýza vět přirozeného jazyka

VĚTNÁ SKLADBA Mgr. Soňa Bečičková

ve strojovém překladu

Ročník: 5. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby

Dataprojektor, jazykové příručky, pracovní listy

Vedlejší věta přísudková

PDT-Vallex: trochu jiný valenční slovník

Název materiálu: Jazykové rozbory

Obsah. Úvodní poznámka 11 Německý jazyk, spisovná řeč a nářečí 13 Pomůcky ke studiu němčiny 15

Olympiáda v českém jazyce 45. ročník 2018/2019

Přísudek a podmět. Český jazyk 9. ročník Mgr. Iveta Burianová

Identifikátor materiálu: EU-3-3, Č, 8.r., Prezentace Přísudek Vytvořeno: Josef Gajdoš (Autor) čeština. - žádné. výklad.

NÁZEV TŘÍDA ANOTACE PLNĚNÉ VÝSTUPY KLÍČOVÁ SLOVA

Olympiáda v českém jazyce 45. ročník, 2018/2019

Morfologie odborných textů

PŘÍSUDEK Předmět: Ročník: Anotace: přísudek Klíčová slova: Autor: Datum: Škola:

ANOTACE K VÝUKOVÉ SADĚ

Depfix: Jak dělat strojový překlad lépe než Google Translate

Workshop o paralelním korpusu InterCorp

Všestranný jazykový rozbor (VJR)

Automatická post-editace výstupů frázového strojového překladu (Depfix)

Příspěvky k české morfologii

IV. Gramatika A. Tvarosloví 1. Slovní druhy

Co nového ve zpracování MWE Automatická identifikace

Olympiáda v českém jazyce 45. ročník, 2018/2019

VY_III/2_Inovace_sada01

2. Přídavná jména Tři stránky tabulek obsahují 156 nejběžnějších anglických přídavných jmen.

Český jazyk a literatura - jazyková výchova

Počítačové zpracování češtiny. Syntaktická analýza. Daniel Zeman

Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.

VY_12_INOVACE_32_ZAKLAD_VETY. Časová dotace: 45 min Datum ověření:

Název materiálu SLOVNÍ DRUHY PODSTATNÁ JMÉNA. Metodika. Pořadové číslo III-2-ČJ-III- 1-9.r.

Rekonstrukce standardizovaného textu z mluvené řeči

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ

Učebnice, cvičebnice, CD-Rom, audio CD a DVD, počítačová učebna, dataprojektor, mapy anglicky mluvících zemí, slovník, interaktivní tabule

SLOVNÍ DRUHY. Vytvořeno dne: druhů, vymezuje tři základní kritéria členění. Závěr prezentace slouží k procvičení osvojených poznatků.

Číslo materiálu: VY 32 INOVACE 27/15

učebnice, cvičebnice, CD-Rom, počítačová učebna, dataprojektor, interaktivní tabule, mapy anglicky mluvících zemí, slovník

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Interpunkční znaménka

Přísudek opakování a rozšíření

Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor (předmět): Český jazyk: jazyková výchova - ročník: PRIMA

Národní institut pro další vzdělávání MŠMT Senovážné náměstí 25, Praha 1

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Kurz č PhDr. Hana Peterková. Skladba. Souvětí podřadné Souvětí souřadné

Český jazyk - Jazyková výchova

SOŠUP L/51

PŘEDMLUVA VÝKLADOVÁ ČÁST

platné nejsou Sokrates je smrtelný. (r) 1/??

7. ročník. Český jazyk a literatura. Komunikační a slohová výchova. Vypravování uspořádání dějových prvků

Čím může bohemistice přispět současná počítačová lingvistika?

Univerzita Karlova v Praze Matematicko-fyzikální fakulta

Olympiáda v českém jazyce 45. ročník, 2018/2019

Ú v o d e m Lekce 2: To je m o je. A ta m to ta k é < t? C D l / l l... 34

Graf skladebného rozboru věty

Základní větné členy

http: //pravopisne.cz/2014/11/test-podstatna-jmena-konkretni-a-abstraktni-11/

Okresní kolo Olympiády v českém jazyce 2003/ ročník

Dataprojektor, kodifikační příručky

Školní vzdělávací program Základní školy a mateřské školy Sdružení

Sémantická interpretace

E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO

Vzdělávací oblast: JAZYK A JAZYKOVÁ KOMUNIKACE Vyučovací předmět: Český jazyk a literatura Ročník: 6.

VĚTNÁ SKLADBA Mgr. Soňa Bečičková

Vytvořil: Mgr. Renáta Pokorná

Číslo projektu: CZ.1.07/1.4.00/

ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE

ICT podporuje moderní způsoby výuky CZ.1.07/1.5.00/ Český jazyk skladba. Mgr. Jana Rozumová

Zvláštnosti větné stavby

1 Výrok a jeho negace

Střední odborná škola a Střední odborné učiliště, Hustopeče, Masarykovo nám. 1 Autor

ANOTACE NA TEKTOGRAMATICKÉ ROVINĚ. DODATKY K ANOTÁTORSKÉ PŘÍRUČCE (S OHLEDEM NA ANOTOVÁNÍ PDTSC A PCEDT) ÚFAL Technical Report TR

základní větné členy podmět Po (vyjádřen, nevyjádřen, všeobecný) a přísudek Přs (slovesný, souslovný, jmenný se sponou, jmenný)

Termíny z ČJ (pozor, obsahuje chyby)

Školní kolo Olympiády v českém jazyce 2009/ ročník

Transkript:

Syntaktická rovina a syntaktické funkce 1. Úvod Nejprve uvedeme stručný přehled rovin v celém systému. Celý systém obsahuje tři roviny, čili každá věta je reprezentována na těchto rovinách: a) slovní rovina (SLOVR) b) morfologická rovina (MORFR) c) syntaktická rovina (SYNTR) 2. Slovní rovina (SLOVR) Na slovní rovině SLOVR jsou jednotlivá ortografická tokenizovaná slova, například rozhodl se jako dvě slova. Slova jako viděls, očs, včeras, vltavotýnský, hornolužický, společenskopolitický jsou na této rovině jako taková. Každé interpunkční znaménko tvoří zvláštní token. Elipsa (tři tečky) je zachycena jako jeden interpunkční token. Na rovině SLOVR není žádná anotace, jen výsledek tokenizace a větné segmentace. 3. Morfologická rovina (MORFR) Každému prvku na rovině MORFR je přiřazeno jediné lemma a jediná morfologická značka jako výsledek automatické morfologické analýzy a disambiguace. Příklad 1 Mějme konstrukci rozhodl se ve větě: Rozhodl se pracovat. Na MORFR odpovídají spojení rozhodl se dva uzly: uzel pro rozhodl uzel pro se. Uzel pro rozhodl obsahuje na MORFR i. jediné lemma rozhodnout ii. jedinou morfologickou značku VpMS---3R-AA--1P nebo VpIS---3R-AA--1P (podle disambiguace v konkrétní větě) Uzel pro nepředložkové se obsahuje na MORFR

i. jediné lemma se ii. jedinou morfologickou značku P7---4----------- 4. Syntaktická rovina (SYNTR) Na rovině SYNTR je struktura věty zachycena bezprostředněsložkovým stromem, v němž jsou terminální a neterminální uzly. Každý terminální uzel má funkci; každý neterminální uzel je jistého typu a s výjimkou řídícího uzlu celé věty má též funkci. V bezprostředněsložkové struktuře na rovině SYNTR nejsou žádné zvláštní uzly pro lexikálně nevyjádřené elementy věty, například pro subjekt finitního predikátu nebo pro subjekt infinitivu. V bezprostředněsložkové struktuře na rovině SYNTR nejsou ani žádné zvláštní uzly pro interpunkci členící větu nebo vyjadřující otázku, zvolání apod. (čárky, tečky, vykřičníky, otazníky). Tyto elementy figurují jen na rovině grafémické a morfologické. 4.1 Typy Typy neterminálních uzlů na nejvyšší typové úrovni jsou dva: Typ A. TypeUnheaded Typ B. TypeHeaded Typ A. TypeUnheaded Typ TypeUnheaded má dále tyto podtypy: Coord: koordinace Apos: apozice MWE (multi-word expression): dále nestrukturovaný víceslovný výraz tj. schematicky: TypeUnheaded [Coord Apos MWE] Uzel typu TypeUnheaded může fakultativně obsahovat morfosyntaktické kategorie. Jednotlivé složky (tj. dcery) nadsložky typu Coord Apos MWE se k této složce připojují jednou z těchto speciálních funkcí: CoMemb ApMemb MWEMemb (viz též níže v přehledu funkcí). Význam koordinace a apozice je jasný, podtyp MWE vystihuje jakýkoli dále nestrukturovaný víceslovný výraz, např. frazém, kolokaci, případně i adordinační spojení. Je-li součástí uvedených typů spojka, je vyjádřena jako zvláštní složka, jíž je typicky přiřazena funkce

CoConj pro spojku v koordinované konstrukci. Není-li spojka součástí koordinace (její součástí jsou např. pouze čárky), není součástí vyjádření koordinace žádná složka označená funkcí CoConj. Příklad 2 Spojení: otec a matka nebo sestra se vyjádří buď takto: [[otec-comemb matka-comemb a-coconj] sestra-comemb nebo-coconj]-fun nebo [otec-comemb [matka-comemb sestra-comemb nebo-coconj]-comemb a-coconj]-fun kde odlišná vyjádření zachycují odlišnou těsnost konjunktů. Fun je proměnná označující funkci celé koordinace ve větě, např. funkci objektu (Obj) ve větě (obj), resp. subjektu (Subj) ve větě (subj): (obj) Vidím otce a matku nebo sestru. (subj) Otec a matka nebo sestra odešli. Příklad 3 Víceslovné výrazy s jedinou funkcí, například víceslovné spojky, jsou vyjádřeny pomocí funkce MWEMemb. Například víceslovná spojka i když je vyjádřena takto: [i-mwememb když-mwememb]-fun kde Fun je prakticky vždy rovno funkci SurfHead (viz níže). Podobně se vyjádří i elementy frazému. 4.2 Funkce Podobně jako uzly typu TypeUnheaded i uzly typu TypeHeaded mají složky (tj. dcery) a každá z těchto dcer má právě 1 funkci (až na výjimky označené jako * viz níže) z tohoto repertoáru: Advb adverbiále AdvbAuxZ zdůrazňovací slovo, které zdůrazňuje slovo jiného slovního druhu než syntaktické substantivum Attr atribut AttrAuxZ zdůrazňovací slovo, které zdůrazňuje syntaktické substantivum Deagent reflexivum v deagentivním významu DeepHead hloubková hlava, může mít jako alias funkci NomPred nebo Advb *Head SurfHead & DeepHead (= konjunkce obou funkcí) NomPred jmenný přísudek Obj objekt ReflTant reflexivum tantum Subj subjekt

SurfHead povrchová hlava VbAttr doplněk tvořící složku s jiným než slovesným tvarem VbAttrV doplněk tvořící složku se slovesným tvarem AuxO nadbytečný element (podle PDT) AuxY zbytkové příslovce nebo částice (obvykle však vyjádřené jako SurfHead) (podle PDT) AuxG grafický symbol s jiným významem ve větě než organizačním (podle PDT) ExD ExDependent (podle PDT) ApMemb člen apozice CoMemb člen koordinace CoConj spojka v koordinaci MWEMemb člen víceslovného výrazu Uvedené funkce mohou mít obecně asociovánu množinu aliasů. Reálně však může mít aliasy pouze funkce DeepHead, a to: NomPred označuje nominální predikát včetně pasíva ve strukturách se sponou vyjádřenou tvarem slovesa být/bývat (Chlapec byl hodný/přistižen.) Advb označuje adverbiále v konstrukcích s tvarem slovesa být/bývat (Byl jsem doma.) 4.2.1 Funkce SurfHead a DeepHead a. Všechny tvary pomocného slovesa být/bývat (pro tvoření minulého a předminulého času, minulého a předminulého kondicionálu, opisného futura a opisného pasíva) včetně spony mají funkci SurfHead. Totéž platí i o kondicionálové částici by. Jenom existenční být má funkci Head. Je to proto, aby se ze struktury věty na SYNTR dala snadno odvodit struktura povrchová (řídícím prvkem takové struktury je SurfHead) či hloubková (řídícím prvkem takové struktury je DeepHead). Podstrom se složkami SurfHead a DeepHead je vždy binární. Například ve větě: Čeněk je hlupák/hloupý/zatčen. má spona je funkci SurfHead a nominální predikát hlupák/hloupý/zatčen funkci DeepHead alias NomPred. Tvar sponového být je jedinou sestrou příslušného nominálního predikátu. Zbývající doplnění složeného predikátu (spona-surfhead, nominální_predikát-nompred) jsou sesterskými uzly otcovského uzlu tohoto složeného predikátu. Tento přístup umožní nenarušit binaritu podstromu: (uzelx-surfhead uzely-deephead). Funkce SurfHead a DeepHead se tedy mohou vyskytnout jen spolu v binárním stromě. b. Zástupné, dispoziční být/bývat: Tento typ lze exemplifikovat těmito příklady: Táta je doma. Táta byl na zahradě.

Boty jsou mi dobře. Spona je tu sestrou nominálního predikátu, zbývající elementy závisejí na dvojici [spona, nominální predikát], a jsou tedy sestrami neterminálu reprezentujícího tuto dvojici. Příklad 4 Věta: Boty jsou mi dobře. má strukturu: [boty-subj [[jsou-surfhead dobře-deephead]-head mi-obj]-head] Funkce DeepHead zde má ovšem alias NomPred. Dvojici (spona, nominální predikát) zde tvoří: (jsou, dobře), nikoli (jsou, mi)! Věta: Táta je na zahradě s Pavlem. má strukturu: [táta-subj [[je-surfhead [na-surfhead zahradě-deephead]-deephead]-head [s-surfhead Pavlem- DeepHead]-Obj]-Head] Funkce DeepHead zde má alias Advb. Čili [je, na zahradě] chápeme jako jeden složený predikát, kde je je spona a [na zahradě] má funkci DeepHead alias Advb. c. Stav a děj Strukturně se na rozdíl od PDT nerozlišuje stav a děj. Pomocné sloveso se vždy chápe jako spona (SurfHead) a jmenný přísudek (pasivní participium/syntaktické adjektivum/syntaktické substantivum) jako DeepHead_alias_NomPred. 4.2.2 Pomocná, modální a fázová slovesa a. Mít/mívat, dostat/dostávat jako pomocná slovesa V rezultativních konstrukcích typu Mám uvařeno má pomocné sloveso mám na rozdíl od spony přisouzenu funkci Head a uvařeno funkci VbAttr. Příklad 5 Věta:

Mám uvařeno. má takovouto strukturu: [mám-head uvařeno-vbattr] b. Modální a fázová slovesa Tato slovesa mají funkci Head. Příklad 6 Ve větě: Začal/Chci pracovat. má začít/chci funkci Head a pracovat funkci Obj: [začal-head pracovat-obj] 4.2.3 Reflexivita K dispozici jsou 3 funkce: Obj ReflTant Deagent Níže uvádíme podtypy reflexivity v našem pojetí. a. Reflexiva tantum Reflexivní částice se/si má funkci ReflTant. Příklady 7 Zasmála se. Líbí se mi to. To se nedá oddiskutovat. Usmyslil si odejít. Všimla si toho. Muž chvějící se hrůzou hrůzoucí. Přizpůsobení se světu po 2. vatikánském koncilu Zde sloveso / adjektivum / substantivum se sestrou reflexiva se/si; sloveso / adjektivum / substantivum má funkci Head a příslušné reflexivum funkci ReflTant.

b. Poloreflexiva tantum I zde má reflexivní částice se/si funkci ReflTant. Příklady 8 Rozhodl se to udělat. Posadil se na židli. Vlévá se do moře. Vlévání se do moře. c. Reflexivum objektové Reflexivní zájmeno se/si má funkci Obj: Příklad 9 Myji se. d. Reflexivum mediopasivní Reflexivní zájmeno se/si zde má funkci Obj nebo Advb. Příklady 10 Myslím si to. Přečti si to. Tak si zavaž tkaničku. Postupte si do vozu. e. Reflexivum pasivní v deagentivní a ergativní konstrukci Reflexivní částice se/si zde má funkci Deagent. Příklady 11 To se nedělá. Tady se nepracuje. To se ti to pracuje. Nechce se mi. f. Reflexivum vyjadřující dispoziční modalitu Reflexivní částice se/si zde má funkci Deagent. Příklady 12 V troubě se dobře peče.

g. Reflexivum reciproční Reflexivní zájmeno se/si zde má Obj. Příklady 13 Koulovali se. Kočkují se. Milují se. Dávají si pusy. Macek s Rathem se fackují/fackuje. Nezavádíme zvláštní funkci pro reciproční reflexivitu, protože reciproké konstrukce se zatím automatickými nástroji rozpoznat nedají. Vše, co má životný objekt, může být totiž reciproční. Literatura Prague Dependency Treebank 2.0. ÚFAL MFF UK, Praha. Dostupný z WWW: <http:ufal.mmff.cuni.cz/pdt2.0> Hajič J., J. Panevová, E. Buráňová, Z. Urešová, A. Bémová, J. Kárník, J. Štěpánek, P. Pajas (1999): Pražský závislostní korpus PDT. Anotace na analytické rovině. Návod pro anotátory. ÚFAL MFF UK, Praha.