Syntakticko sémantický popis vybraných skupin sloves vyjadřujících emoce a pocity. Elżbieta Kaczmarska

Podobné dokumenty
Elżbieta Kaczmarska, PhD. Institute of Western and Southern Slavic Studies University of Warsaw

Elżbieta Kaczmarska. Institute of Western and Southern Slavic Studies University of Warsaw

Jak najít optimální překlad polysémních sloves porovnání metod automatické analýzy paralelních textů

Institut západní a jižní slavistiky. Elżbieta Kaczmarska 2

Jak najít optimální překlad polysémních sloves porovnání metod formální analýzy paralelních textů 1

Korpus fikčních narativů

Institut západní a jižní slavistiky. Elżbieta Kaczmarska 2

KORPUSOVÝ WORKSHOP. Václav Cvrček, Lucie Chlumská Univerzita Karlova v Praze VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT!

Juxtapozice z do v Arabštině

1. Přehled cizojazyčných a vícejazyčných korpusů

Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech

SYNTAX LS Úvod

Radomír Hanzelka AGENTURA OSIRIS KNIHA DRUHÁ

Forex Edge 31. srpna 2016

Sémantický web a extrakce

2. neděle velikonoční C. S vírou v Ježíše Krista, našeho Pána a Boha, prosme za církev a za celý svět. (Budeme odpovídat: Pane, smiluj se.

2. Korpusový portál a volně dostupné nástroje

VALENČNÍ SLOVNÍK ČESKÝCH SUBSTANTIV: VÝCHODISKA A CÍLE

Slavnost Ježíše Krista Krále. Cyklus B Mt 25,31-46

Přísudek. Vytvořeno dne: ve větě

7. NEDĚLE VELIKONOČNÍ CYKLU C

Návštěva. 2 vyučovací hodiny 4.ročník 4letého gymnázia vstup do tématu kooperativní vyučování metody dramatické výchovy

Korpusová lingvistika a počítačové zpracování přirozeného jazyka

Dítky, jen krátký čas jsem s vámi.

Anotace žákovského korpusu. Alena Poncarová Žďárek, Listopad 2011

Literární moderna - úvod

Kolísání rodu substantiv

Depfix: Jak dělat strojový překlad lépe než Google Translate

2. neděle velikonoční B. S vírou v Ježíše Krista, našeho Pána a Boha, prosme za církev a za celý svět. (Budeme odpovídat: Pane, smiluj se.

bab.la Fráze: Osobní Všechno nejlepší česky-polsky

Větná polarita v češtině. Kateřina Veselovská Žďárek Hořovice,

Byla to láska. Kytička milostné poezie. Obsah: Když jsem byla hodně malá. Pomalu vrůstám do tebe. Kdybych to dovedl. Byla to láska.

ROMÁNSKÉ JAZYKY A ČEŠTINA VE SVĚTLE PARALELNÍCH KORPUSŮ

Newsletter Forex Edge je připravován a rozesílán společností LYNX jednou za dva týdny.


5 + 1 věc, kterou potřebuje každý dobrý marketingový příběh

Malý Ježíš měl také malé kamarády. Nazaretské děti si s ním rády hrály. Ježíš se vždycky nejdříve zeptal maminky a teprve potom si šel ven hrát. Chlap

ve strojovém překladu

Korpusová lingvistika a počítačová lexikografie. Od 60. let 20. st.

ZSE Gorlice (Polsko) SPŠ Bardejov (Slovensko) Gymnázium, České Budějovice, Česká 64

PŘEDMLUVA VÝKLADOVÁ ČÁST

Vývoj vybraných hodnotových orientací studentů FHS UK mezi roky (pro 6. olomouckou podzimní sociologickou konferenci)

Je komunikovať s nevyliečiteľne chorým problém? Anna Hrtúsová. AKH Wien

23. Věta jednoduchá Vypracovala: Mgr. Soňa Matůšová, leden 2013

26. neděle v mezidobí. Cyklus A Mt 21,28-32

Newsletter Forex Edge je připravován a rozesílán společností LYNX jednou za dva týdny.

Karel Čapek BÍLÁ NEMOC (1937)

Třinácté komnaty dětské duše Violet Oaklander (Co všechno děti zbožňují a co paní Violet ráda dělá)

Lord You're Mighty. Youthful Praise. Pane, jsi mocný...

Církev ve světle druhého příchodu Ježíše Krista

Slovní druhy. Metodika: Pracovní list je určen ke skupinové i k samostatné práci. Jednotlivá cvičení jsou věnována jednotlivým slovním druhům.

Občané o Lisabonské smlouvě

Rudolf Medek: ZBOROV

Ver.03/2013 SANOMA MEDIA PRAHA 2013 MEDIA DATA

Bílý. kámen. 1. Bílý kámen (P. Lochman, J. rejent / V. Kočandrle, I. Bartošová) 2. Lípo stoletá (V. kočandrla / V. Kočandrle)

Dotazníkové šetření spokojenosti se sociální pobytovou službou Domova důchodců Horní Planá. Vyhodnocení Dotazníků pro obyvatele Domova důchodců

STŘEDNÍ ODBORNÁ ŠKOLA a STŘEDNÍ ODBORNÉ UČILIŠTĚ, Česká Lípa, 28. října 2707, příspěvková organizace

Marketingový výzkum 2

Cesta za Vaším pokladem tedy ebookem ;)

Honzík. dobrodružství v městečku Postýlkov

MUDr. Barbora Branna

Jazyk a jazyková komunikace 2. ročník a sexta

Naše mysl se podobá moři nebo oceánu. Bouře, JAK PŘEŽÍT VNITŘNÍ BOUŘI

Na úvod pár slov, jak je úžasná tato kniha. Co nám dává? Dává nám poznat obraz, jaký je Bůh, jaké je jeho srdce.

Newsletter Forex Edge je připravován a rozesílán společností LYNX jednou za dva týdny.

V sobotu v 15:00 představení Myši patří do nebe (ale jenom na chvíli)

pískovaný celopísek jen text (negativ) (pozitiv) Pískování na láhev vína: + cena vína dle Vašeho výběru (pouze láhve VÍNO HRUŠKA) Pískování na přání:

Newsletter Forex Edge je připravován a rozesílán společností LYNX jednou za dva týdny.

Korpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105

NomVallex: Valenční slovník českých substantiv založený na korpusu

Newsletter Forex Edge je připravován a rozesílán společností LYNX jednou za dva týdny.

Květná neděle. Neboť ty jsi, Pane, zemřel, abychom my mohli žít. Tobě buď chvála na věky věků. Amen.

ANOTACE K VÝUKOVÉ SADĚ

NOVÝ ROK Nový začátek, nový život

Identifikátor materiálu: EU-3-3, Č, 8.r., Prezentace Přísudek Vytvořeno: Josef Gajdoš (Autor) čeština. - žádné. výklad.

VY_12_INOVACE_72 Základní škola a mateřská škola Herálec, Herálec 38, ; IČ: ; tel.:

Obsah MILOST. Milost je projevem Boží lásky k nám. UCTÍVÁNÍ. Oslavujeme Boha za to, že se o nás laskavě stará. SPOLEČENSTVÍ

Člověk a společnost. 13. Etika. Vytvořil: PhDr. Andrea Kousalová. Etika. Etika Etika Strana: 1 CZ.1.07/1.5.00/34.

Fotografie Jiřího Ortena: originály archiválií jsou uložené v Památníku národního písemnictví literární archiv.

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

10. Techniky formální verifikace a validace

POPELKA. Mateřská škola, základní škola a Dětský domov Ivančice, Široká 42. Autor: Mgr. Marta Kvasničková

EU PENÍZE ŠKOLÁM Operační program Vzdělávání pro konkurenceschopnost

FÁZOVÉ PERIFRÁZE V PORTUGALŠTINĚ

6/2014. dobroučské farnosti. Slovo duchovního správce. neděle 1. června neděle velikonoční. Tajemství Eucharistie. Intence

Z HISTORIE STATISTIKY

Anotace: Autor: Jazyk: Očekávaný výstup: Speciální vzdělávací potřeby: Klíčová slova: Druh učebního materiálu: Druh interaktivity: Cílová skupina:

Ale jak to, že nás má tolik stát život s Pánem který dává spasení zdarma, který za nás - jak víme - cele zaplatil svým životem?

Guy. ilbert. Partnerství. Jak uspìt ve velkém dobrodružství lásky

Důvěra v evropské a mezinárodní instituce duben 2017

Typy predikátů: slovesa, predikativní jména, adjektiva, tranzitivní slovesa, relativní 1 věty / 10

Cestování Zdraví. Zdraví - Pohotovost. Zdraví - U doktora. Muszę iść do szpitala. Otázka ohledně toho, zda můžete být převezeni do nemocnice

Povinnost elektronické komunikace v zákoně o zadávání veřejných zakázek. Vlastimil Fidler Ministerstvo pro místní rozvoj

Frekvence lásky. Ukázka knihy z internetového knihkupectví

28. neděle v mezidobí. Cyklus B Mk 10,17-30

Něco o mně. Tvary zájmena já nahraďte tvary zájmena ty

Bible pro děti představuje. Narození Ježíše

Jan Zahradníček. MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/

POLENDÁRˇ. Vydáno nákladem více než ekonomickým. Vytisknuto v pravý čas a na pravém místě. Výběr básní z let provedl sám autor.

Transkript:

Syntakticko sémantický popis vybraných skupin sloves vyjadřujících emoce a pocity

Syntakticko sémantický popis sloves valenční popis Valencí rozumíme počet argumentů řízených slovesným predikátem spolu s jejich morfosyntaktickými a sémantickými vlastnostmi Valence prostředek usnadňující vzhledavání ekvivalentů (popis valenčního rámce není cílem) Navazujeme na předchozí referát 2

Valence není cílem VERB Valence analysis Case Grammar Pattern Grammar Cognitive Grammar Equivalent equivalent equivalent equivalent equivalent equivalent 3

Pokusíme se ověřit, zda volbu usnadňují valenční požadavky derivátů popisovaných sloves (plán) Studii provedeme na materiálu z paralelního korpusu InterCorp. Některé třídy českých slov (zejména sloves) se do polštiny překládají zvlášť obtížně slovesa vyjadřující emoce a pocity 4

toužit cs Jsi krásná, nepřestanu po tobě toužit a bát se tvé krásy pl Jesteś piękna, nigdy nie przestanę cię pragnąć i bać się twojej urody cs Celý život jsem toužila po skutečném domově. pl Całe życie tęskniłam za prawdziwym domem. cs Vždycky jsem toužila po člověku, který by byl prostý a přímý. pl Zawsze marzyłam o człowieku, który był by prosty i bezpośredni. 5

toužit 304 pragnąć 107 chcieć 82 tęsknić 70 marzyć 40 pożądać 24 ochota 9 zapragnąć 8 pragnienie 8 tęsknota 8 zależeć 7 spragniony 6 życzyć Předběžný výzkum slovesa toužit (Kaczmarska Rosen 2013) 6

NP nom toužit po NP loc toužit po Oabstr toužit po Ohum toužit po OR NP nom toužit inf toužit inf NP nom toužit po tom, aby (S) toužit po tom, aby... NP nom toužit, aby (S) toužit, aby... Předběžný výzkum slovesa toužit (Kaczmarska Rosen 2013) 7

toužit po Oabstr Netoužím po tomhle slizkém bratrství. toužit po Ohum Jsi krásná, nepřestanu po tobě toužit a bát se tvé krásy, miluji tě až do smrti, ale ještě více tě nenávidím. po + OR toužit po / do OR a toužil jsem najednou žíznivě po Praze, po své práci, po psacím stolku ve svém bytě, po knihách. do + OR to tělo již toužilo do hrobu. toužit + inf Každý z nás touží překročit erotické konvence, erotická tabu, a vstoupit v omámení do království Zakázaného. toužit, aby a ona toužila, aby se nedělo nic. toužit + S toužit po tom, aby 8 Nesmírně toužila po tom, aby se s ní oženil,

Filtrování jaké polské ekvivalenty objevují se v jednotlivých skupinách 9

toužit + Ohum 10

toužit + Oabstr 11

toužit + OR 12

toužit + inf 13

toužit po S 14

toužit + S 15

Srovnání výsledků ruční a automatické analýzy 16

17

chcieć marzyć pożądać pragnąć tęsknić OR 16,2% 18,9% 10,8% 27,0% 27,0% 100,0% Oabstr 16,8% 15,5% 5,6% 39,1% 23,0% 100,0% Ohum 10,7% 3,6% 23,2% 41,1% 21,4% 100,0% 0R/Oabstr 18,3% 17,1% 6,1% 42,7% 15,9% 100,0% Ohum/0abstr 14,3% 0,0% 0,0% 42,9% 42,9% 100,0% Ohum/OR 21,6% 8,2% 9,7% 45,5% 14,9% 100,0% any 7,8% 18,8% 21,9% 32,8% 18,8% 100,0% 16,5% 13,1% 10,7% 39,9% 19,8% 100,0% 18

chcieć marzyć pożądać pragnąć tęsknić OR 6,7% 9,9% 6,9% 4,6% 9,3% 6,8% Oabstr 30,3% 35,2% 15,5% 29,2% 34,6% 29,8% Ohum 6,7% 2,8% 22,4% 10,6% 11,2% 10,4% 0R/Oabstr 16,9% 19,7% 8,6% 16,2% 12,1% 15,2% Ohum/0abstr 1,1% 0,0% 0,0% 1,4% 2,8% 1,3% Ohum/OR 32,6% 15,5% 22,4% 28,2% 18,7% 24,8%? 5,6% 16,9% 24,1% 9,7% 11,2% 11,8% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 19

NP nom toužit po Np loc Experiencer Stimul (Oabstr) Ohum OR člověk láska ona divadlo národ pomsta kluk byt Evropská unie vysvětlení dítě domov stromy krása tělo milence snídani 20 přechodná skupina objektů? potřeba zkoumání kolokability

Podrobnější analýza / rozlišení abstraktních objektů toužit po skutečném přátelství / nezapomenutelném dobrodružství skutečné přátelství prawdziwa przyjaźń nezapomenutelné dobrodružství niezapomniana przygoda Marzę o prawdziwej przyjaźni / niezapomnianej przygodzie. Tęsknię za prawdziwą przyjaźnią / niezapomnianą przygodą (???) Tęsknię do prawdziwej przyjaźni / niezapomnianej przygody (???) Pragnę prawdziwej przyjaźni / niezapomnianej przygody (?) 21

Další faktory ovlivňující vyběr ekvivalentů Marzę o małym domku nad oceanem. Tęsknię za moim synem. Pragnę dziecka. Časování objektů? Existuje teď? Existoval? Teprve se objeví? Znám objekt? Marzę o szklance wody. Pragnę go z całego serca. 22

Word Sketches Analyzujeme jen 3 polské ekvivalenty INFINITIV toužit inf-x pragnąć inf * marzyć inf * tęsknić inf post_inf 17 405 post_inf 6 800 mít 926 podziękować 805 stát 864 podkreślić 598 poznat 382 pogratulować 379 vidět 346 wyrazić 391 vrátit 333 zwrócić 319 hrát 333 przypomnieć 165 získat 332 powiedzieć 386 dostat 311 zauważyć 97 vyhrát 285 rozpocząć 73 žít 177 poruszyć 58 jít 176 powtórzyć 51 najít 152 skorzystać 70 udělat 143 powitać 43 spatřit 132 dodać 70 uspět 124 zaznaczyć 40 dělat 105 przyłączyć 33 napravit 101 wezwać 39 zůstat 99 zapytać 43 pracovat 96 poinformować 46 podívat 92 pochwalić 26

Experiment s kolokatorem PELCRA (NKJP) Word Sketches (InterCorp) pragnąć has_gen_obj 809 co 76 to 52 Europa 34 zachęcić 26 strona 16 coś 15 powód 14 region 14 śmierć 13 demokracja 12 debata 12 grupa 12 zmiana 12 parlament 11 pokój 10 rozwój 10 okazja 9 wolność 8 Word Sketches (CNK) toužit po post_po 23 752 dítě 697 láska 599 návrat 555 úspěch 493 vítězství 457 změna 455 život 361 medaile 316 pomsta 287 klid 282 vztah 271 moc 267 postup 266 kariéra 263 titul 263 rodina 246 svoboda 218 výhra 189 bod 174

zatoužit Derivát slovesa toužit 40 zapragnąć 14 zatęsknić 11 pragnąć 7 tęsknić 6 pożądać 6 żałować 5 zechcieć 4 chęć 4 pragnienie 3 chcieć 3 marzyć 3 ochota 26

NP nom zatoužit po NP loc zatoužit po Oabstr zatoužit po Ohum zatoužit po OR NP nom zatoužit inf zatoužit inf NP nom zatoužit po tom, aby (S) zatoužit po tom, aby... NP nom zatoužit, aby (S) zatoužit, aby... zatoužit 27

toužit stýskat se (27) tesknit (8) 28

29 stýskat se 83 tęsknić 10 tęsknota 9 brakować 6 zatęsknić 5 stęsknić 4 brak 3 tęskno 2 nostalgia 2 smutno 2 żal 1 cknia 1 nostalgiczny 1 nudno 1 pragnąć 1 rwać 1 spragniony

stýskat se NP nom stýskat se po NP loc stýskat se po Oabstr stýskat se po Ohum stýskat se po OR stýskat se že (?) 30

stýskat se stýskat se tęsknić 4 być niedobrze 1 być smutno 1 być spragnionym 1 error 1 stýskat se po Oabstr tęsknić za Oabstr 2 zatęsknić do Oabstr 1 być żal 1 żałować 1 stýskat se po Ohum być smutno bez Ohum 1 tęsknić za Ohum 4 tęsknić do Ohum 4 31 stýskat se po OR tęsknić do OR 1 tęsknota za OR 1

Závěry a výhledy Valence nerozhoduje jednoznačně o volbě ekvivalentu Korpus umožňuje vymezení skupin ekvivalentů Konfrontace jazyků často nekompatibilní nástroje Word Sketches zpracovány pro polskou část InterCorpu (ne pro českou), nejsou dostupné pro externí uživatele Word Sketches zpracovány pro SYN. Srovnatelný pro polštinu je NKJP, ale nemůžeme použít pro něj Word Sketches. Korpus český a polský mají jiné statistické funkce. toužit / zatoužit Chybí vyzkum s prefixy (u sloves pohybu může být relevantní) 32