Jak najít optimální překlad polysémních sloves porovnání metod automatické analýzy paralelních textů

Rozměr: px
Začít zobrazení ze stránky:

Download "Jak najít optimální překlad polysémních sloves porovnání metod automatické analýzy paralelních textů"

Transkript

1 Jak najít optimální překlad polysémních sloves porovnání metod automatické analýzy paralelních textů Elżbieta Kaczmarska, Alexandr Rosen a Jirka Hana Instytut Slawistyki Zachodniej i Południowej, Wydział Polonistyki Uniwersytetu Warszawskiego Ústav teoretické a počítačové lingvistiky, Filozofická fakulta & Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Korpusová lingvistika 2014 Praha, 17. září 2014 Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 1 / 45

2 O čem budeme mluvit 1 Motivace 2 Ruční analýza 3 Předběžné shrnutí 4 Automatická excerpce ekvivalentů 5 Stochastické modelování lexikální ekvivalence 6 Perspektivy 7 Literatura Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 2 / 45

3 O čem budeme mluvit Motivace 1 Motivace 2 Ruční analýza 3 Předběžné shrnutí 4 Automatická excerpce ekvivalentů 5 Stochastické modelování lexikální ekvivalence 6 Perspektivy 7 Literatura Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 3 / 45

4 Motivace Problém s porozuměním a překladem sloves zejména se slovesy vyjadřujícími psychický stav často více ekvivalentů s výraznými rozdíly ve významu Neúplné / nedostatečné informace v tradičních slovnících chybí informace o valenci chybí příklady, které by pomohly ve volbě ekvivalentu [Oliva(1994)] 80 tisíc hesel [Siatkowski & Basaj(2002)] 53 tisíc hesel + 28 tisíc výrazů Příklad: toužit tęsknić tesknit (po čem), stýskat se (komu po čem) marzyć snít (o čem) pragnać prahnout (po čem) [Kaczmarska & Rosen(2013)] (Nezabýváme se definicí pojmů valence a ekvivalent.) Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 4 / 45

5 Cíle Motivace Prozkoumat význam polysémních lexémů srovnáním s jejich ekvivalenty v jiném jazyce, např. v polštině Problémy s volbou ekvivalentu jsou běžné u typologicky vzdálených jazyků, ale vyskytují se i u jazyků spřízněných Najít faktory, které vedou k volbě konkrétního ekvivalentu, na základě kontextu a syntakticko-sémantických vlastností argumentů daného lexému ve zdrojovém jazyce Porovnat různé metody: manuální automatické založené na pravidlech stochastické Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 5 / 45

6 Motivace Je volba ekvivalentu dána valenční strukturou? toužil.. pragnał.. marzył.. tęsknił....po vlasti..ojczyzny..o ojczyźnie..za ojczyzna / do ojczyzny..po pivu..piwa..o piwie..za piwem..najít smysl..znaleźć....o tym, żeby....do tego života za tym żeby....po tom, aby..żeby go lubili..o tym, żeby....do tego / ho měli rádi za tym, żeby..??? Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 6 / 45

7 Co říká korpus? Motivace Paralelní korpus jako zdroj možných ekvivalentů Z paralelních konkordancí obsahující daný lexém lze zjistit: valenční rámec lexému argumenty rámce porovnání významových odstínů agregované údaje pomocí statistické analýzy Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 7 / 45

8 Motivace Analýza Ruční analýza paralelních konkordancí Automatické zarovnání po slovech, automatická excerpce dvoujazyčného slovníku Natrénování a evaluace statistického modelu, který by rozhodl o polských ekvivalentech s využitím českého kontextu ve dvou podobách: nestrukturovaný, lineární kontext syntakticky závislé členy Porovnání s lexikálními/kolokačními profily (Word Sketches, Kolokator) Frekvenční poměry lexémů ověřeny na vyvážených jednojazykových korpusech Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 8 / 45

9 Motivace Data: InterCorp, verze 6 InterCorp vícejazykový paralelní korpus s češtinou uprostřed součást Českého národního korpusu Texty v 31 jazycích + česky Velikost celkem 867/100 mil. slov (cizí/české) Jádro 139/62 mil. slov: beletrie s ručně zkontrolovaným zarovnáním po větách Z toho česko-polská část 12 mil. slov v každém jazyce Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 9 / 45

10 O čem budeme mluvit Ruční analýza 1 Motivace 2 Ruční analýza 3 Předběžné shrnutí 4 Automatická excerpce ekvivalentů 5 Stochastické modelování lexikální ekvivalence 6 Perspektivy 7 Literatura Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 10 / 45

11 Ruční analýza Ruční analýza 1 konkordance sledovaných lexémů v českých originálech 2 anotace podle předmětového argumentu českého lexému: lidská bytost Ohum abstraktum Oabstr konkrétum OR vedlejší věta S infinitiv inf 3 anotace podle podle předmětového argumentu polského ekvivalentu 4 identifikace pravidel pro volbu ekvivalentu podle typu argumentu Výsledky ukazují, jak konkrétní valenční rámec (např. slovesa toužit) (spolu)rozhoduje o překladu. Budeme zkoumat toužit v českých originálech, celkem 219 výskytů. Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 11 / 45

12 Ruční analýza Překlady toužit po OHUM ekvivalent argument počet marzyć o Ohum 2 mieć ochotę inf 1 pożadać Ohum 5 pożadany Ohum 1 pragnać X 1 pragnać inf 1 pragnać Oabstr 1 pragnać Ohum 12 tęsknić X 1 tęsknić do S 1 tęsknić do Oabstr 1 tęsknić do Ohum 5 tęsknić za Ohum 2 zapragnać Oabstr 1 zatęsknić za Ohum 1 żywić miłość do Ohum 1 CELKEM 37 Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 12 / 45

13 Ruční analýza Příklady toužit po OHUM toužit po OHUM pragnać OHUM cs Jsi krásná, nepřestanu po tobě toužit a bát se tvé krásy... pl Jesteś piękna, nigdy nie przestanę cię pragnać i bać się twojej urody... toužit po OHUM tęsknić do S cs Miláčku, já netoužím po rodině. pl Kochanie, ja nie tęsknię do tego, by założyć rodzinę. toužit po OHUM marzyć o OHUM cs Vždycky jsem toužila po člověku, který by byl prostý a přímý. pl Zawsze marzyłam o człowieku, który był by prosty i bezpośredni. Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 13 / 45

14 Ruční analýza Překlady toužit po OABSTR chcieć inf 1 dażyć do Oabstr 2 dbajacy o to S 1 dybać na Oabstr 1 imponować Oabstr 1 marzyć o Oabstr 20 marzyć o Ohum (změna struktury) 1 myśleć o Oabstr 1 pożadać Oabstr 5 pragnać S 1 pragnać inf 4 pragnać Oabstr 29 pragnienie Oabstr 1 szukać Oabstr 1 tęsknić do Oabstr 11 tęsknić za Oabstr 7 tęskno za Oabstr 1 upragniony Oabstr 1 zamierzać inf 1 zapragnać inf 1 żadny Oabstr 1 JINÉ (podstatná změna struktury) 2 CELKEM 94 Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 14 / 45

15 Ruční analýza Příklady toužit po OABSTR toužit po OABSTR pragnać OABSTR Toužíte po odvetě. Pragnie pan odwetu. toužit po OABSTR tęsknić do OABSTR Já toužím po lásce.?ja tęsknię do miłości. toužit po OABSTR marzyć o OABSTR byli jsme unaveni, promočeni a toužili jsme po odpočinku. byliśmy zmęczeni, przemoczeni i marzyliśmy o odpoczynku. Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 15 / 45

16 Překlady toužit po OR Ruční analýza chcieć inf 1 marzyć S 1 marzyć o OR 5 obiekt pożadania 1 pragnać inf 1 pragnać OR 3 tęsknić za OR 2 CELKEM 14 Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 16 / 45

17 Ruční analýza Příklady toužit po OR toužit po OR tęsknić za OR cs Celý život jsem toužila po skutečném domově pl Całe życie tęskniłam za prawdziwym domem toužit po OR marzyć o OR cs Mladý muž touží po vlastním divadle. pl Młody mężczyzna marzył o własnym teatrze. Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 17 / 45

18 Ruční analýza Překlady toužit + INF być pragnieniem inf 1 chcieć inf 20 chętnie S 1 dbać o Oabstr 1 marzyć o Oabstr 4 mieć marzenie inf 1 mieć ochotę inf 1 pragnać inf 44 pragnać S 1 pragnać Oabstr 3 tęsknić za S 1 zachciewać się Oabstr 1 JINÉ (podstatná změna struktury) 1 CELKEM 80 Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 18 / 45

19 Příklady toužit INF 1/2 Ruční analýza toužit INF chcieć INF cs Toužil jsem vidět ho zblízka, anebo se aspoň zeptat, kdo to je a co znamená. pl Strasznie chciałem zobaczyć go z bliska albo przynajmniej się spytać, kto to jest i co to znaczy. toužit INF pragnać INF cs Dobře děláš, řekl náhle v obluzení, touže ji zlíbat a cítě strach. pl Dobrze robisz rzekł jak urzeczony, pragnac ucałować ja i czujac jednocześnie strach. Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 19 / 45

20 Ruční analýza Příklady toužit INF 2/2 toužit INF marzyć o OABST cs Netoužila o něm dlouze rozprávět. pl Nie marzyła o długiej rozmowie na ten temat. toužit INF mieć marzenie INF cs Soudruh hrozně toužil si s Helenou promluvit. pl Towarzysz miał jedno marzenie: rozmawiać z Helena. toužit INF tęsknić za S cs Nakonec toužíte poznat někoho obyčejnýho. pl W końcu tęskni się za tym, by poznać kogoś zwyczajnego. Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 20 / 45

21 Překlady toužit po S Ruční analýza pragnać inf 1 pragnać S 2 chcieć S 1 marzyć się Nom 1 CELKEM 5 Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 21 / 45

22 Ruční analýza Příklady toužit po S toužit po S pragnać S cs Nesmírně toužila po tom, aby se s ní oženil pl Pragnęła bardzo, żeby się z nia ożenił toužit po S chcieć S cs Obama netouží po tom, aby se problémy evropského dluhu rozšířily do Ameriky. pl Prezydent Obama nie chce przecież, żeby europejski problem długu państwowego przeniósł się do Ameryki. Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 22 / 45

23 Překlady toužit S Ruční analýza chcieć S 1 chcieć inf 1 marzyć S 2 pragnać S 11 pragnać inf 2 życzyć sobie S 1 CELKEM 18 Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 23 / 45

24 Příklady toužit S Ruční analýza toužit S pragnać S cs Celý život toužil, aby milovaná žena byla s to tlouci kvůli němu hlavou o zed, křičet zoufalstvím anebo skákat radostí po pokoji. pl Przez całe życie pragnał, żeby ukochana kobieta gotowa była bić dla niego głowa w mur, wyć z rozpaczy i skakać z radości po mieszkaniu. toužit S marzyć S cs Touží, aby ji někdo odnaučil být anachronická! pl Marzy, by ktoś nauczył ja, jak nie być anachroniczna! toužit S chcieć INF cs Toužila, aby s ní sdílelo její samotu alespoň nějaké zvířátko pl Chciała dzielić z kimś swa samotność, choćby z jakimś zwierzatkiem. Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 24 / 45

25 O čem budeme mluvit Předběžné shrnutí 1 Motivace 2 Ruční analýza 3 Předběžné shrnutí 4 Automatická excerpce ekvivalentů 5 Stochastické modelování lexikální ekvivalence 6 Perspektivy 7 Literatura Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 25 / 45

26 toužit (po) cs pl pl val Σ Oa Oh OR inf S Σ Oa Oh OR inf S X chcieć Oa chcieć inf chcieć S dażyć do Oa łaknać OR marzyć o Oa marzyć o Oh marzyć o OR marzyć S mieć ochotę inf pożadać Oa pożadać Oh pragnać Oa pragnać Oh pragnać OR pragnać Inf pragnać S pragnać pragnienie Oa+ing (s)próbować inf spragniony Oa tęsknić do Oa tęsknić do Oh tęsknić za Oa tęsknić za Oh tęsknić za OR złakniony Oa JINÉ Σ

27 Předběžné shrnutí Valence je nejspolehlivější faktor pro výběr ekvivalentu u: toužit + INF nejčastějšími ekvivalenty (> 80 %) jsou: pragnać + INF chcieć + INF Co rozhoduje v ostatních případech: kontext sémantický podtyp OABSTR personifikace tęsknić / bez personifikace tęsknić známý tęsknić / neznámý tęsknić více reálný pragnać / méně reálný marzyć Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 27 / 45

28 Předběžné shrnutí toužit po velké lásce / exotické cestě Marzyć o wielkiej miłości / egzotycznej podróży Tęsknić za wielka miłościa / * egzotyczna podróża Tęsknić do wielkiej miłości / * egzotycznej podróży Pragnać wielkiej miłości /? egzotycznej podróży Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 28 / 45

29 Předběžné shrnutí toužit po OABSTR tęsknić do OABSTR cs Toužila po světě, kde lidé mluví jinou řečí než on. pl Tęskniła do świata, w którym ludzie mówia innym językiem niż on. (který už zná) pl jiné významy: pragnęła świata / marzyła o świecie... (? / který nikdy neviděla) toužit po OABSTR pragnać OABSTR cs Tomáš toužil po světě, kde by vládla spravedlnost. pl Tomasz pragnał świata, w którym panowałaby sprawiedliwość. (který nezná, nemá s ním zkušenost, neexistuje) pl jiné významy: tęsknił do świata / marzył o świecie... (s nímž má zkušenost /?) Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 29 / 45

30 Automatická excerpce ekvivalentů O čem budeme mluvit 1 Motivace 2 Ruční analýza 3 Předběžné shrnutí 4 Automatická excerpce ekvivalentů 5 Stochastické modelování lexikální ekvivalence 6 Perspektivy 7 Literatura Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 30 / 45

31 Automatická excerpce ekvivalentů Automatická excerpce ekvivalentů Tools: Zarovnání po slovech: GIZA++ Texts: InterCorp verze 6 pouze beletrie bez dělení na české/polské/cizí originály pouze zarovnání 1:1 české texty: 11,9 mil. slov polské texty: 11,9 mil. slov počet excerpovaných lemmat: 8,7 mil. dvojic počet dvoujazyčných hesel: 0,5 mil. počet lemmat: 121 tis. českých, 98 tis. polských Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 31 / 45

32 Automatická excerpce ekvivalentů 304 toužit pragnać 107 toužit chcieć 82 toužit tęsknić 70 toužit marzyć 40 toužit pożadać 24 toužit ochota 9 toužit zapragnać 8 toužit pragnienie 8 toužit tęsknota 8 toužit zależeć 7 toužit spragniony 6 toužit życzyć 5 toužit upragniony 4 toužit chęć 4 toužit szukać 4 toužit zatęsknić Celkem dvojic s toužit výskytů: 540 unikátních: 53 Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 32 / 45

33 Automatická excerpce ekvivalentů O volbě mezi automaticky excerpovanými ekvivalenty jednoho lexému nelze rozhodnout bez kontextu, jediným dalším údajem je frekvence. I tak lze takový slovník použít jako základ pro kontrastivní lexikální výzkum. Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 33 / 45

34 Stochastické modelování lexikální ekvivalence O čem budeme mluvit 1 Motivace 2 Ruční analýza 3 Předběžné shrnutí 4 Automatická excerpce ekvivalentů 5 Stochastické modelování lexikální ekvivalence 6 Perspektivy 7 Literatura Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 34 / 45

35 Stochastické modelování lexikální ekvivalence Stochastické modelování lexikální ekvivalence Hypotéza: volba ekvivalentu je dána kontextem Metoda 1: lineární kontext Metoda 2: syntakticky závislé členy / argumenty WIP Je možná standardní evaluace (trénovací/testovací data) Pozor: data nejsou ručně opravena Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 35 / 45

36 Stochastické modelování lexikální ekvivalence Metoda 1: lineární kontext InterCorp verze 7, česko-polská beletrie 10 mil. dvojic slov lemmatizace (v češtině i polštině) zarovnání po slovech pro každý sledovaný český lexém nasbíráme slova z kontextu naivní Bayesův klasifikátor rysů; alternativy dávají stejné nebo horší výsledky v úvahu bereme ekvivalenty, které se na celkovém počtu překladových ekvivalentů daného českého lexému podílejí aspoň 1% Kontext: zleva a zprava: 4+4 pozice (včetně interpunkce) všechna slova si jsou rovna, bez ohledu na vzdálenost uvažujeme jen slova s frekvencí 5 a více nefiltrujeme pomocí stopwords Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 36 / 45

37 Evaluace Stochastické modelování lexikální ekvivalence 10-fold cross-validation 5 českých predikátů: (být) líto mrzet toužit trápit (se) zdát (se) česky frekvence počet polských ekvivalentů správně Kappa líto % 30.5% mrzet % 23.0% toužit % 10.1% trápit % 30.5% zdát % 8.6% Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 37 / 45

38 Stochastické modelování lexikální ekvivalence Kontingenční tabulka (confusion matrix) pro líto a b c d e f < určeno jako a = współczuć b = żałować c = szkoda d = przepraszać e = przykro f = żal Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 38 / 45

39 Stochastické modelování lexikální ekvivalence být líto + NP DAT + NP GEN = żal Je mi ho samozřejmě líto. Jest mi go oczywiście żal... být líto + NP DAT + to / Ø = (być) przykro Potom nám to bylo oběma líto. Potem nam obu było przykro. Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 39 / 45

40 Stochastické modelování lexikální ekvivalence Metoda 2: zavislé/argumenty InterCorp verze 7, česko-polská beletrie, 18 mil. českých tokenů lemmatizace (v češtině i polštině) stochastická syntaktická analýza češtiny: struktura a funkce identifikace efektivních řídících členů zarovnání po slovech pro každý sledovaný český lexém sběr syntaktického kontextu (závislých členů) pravděpodobnostní závislostní klasifikátor Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 40 / 45

41 O čem budeme mluvit Perspektivy 1 Motivace 2 Ruční analýza 3 Předběžné shrnutí 4 Automatická excerpce ekvivalentů 5 Stochastické modelování lexikální ekvivalence 6 Perspektivy 7 Literatura Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 41 / 45

42 Perspektivy Perspektivy Porovnání stochastických metod 1 a 2: co vlastně rozhoduje o volbě ekvivalentu? Generalizace z lexémů na místě závislých/argumentů do sémantických tříd pomocí tezauru Syntaktická analýza polštiny ke zjištění argumentů a symetrickému porovnání? Další rysy pro klasifikátor z kontextu? Jde o podobný úkol jako WSD (word sense disambiguation), možná inspirace pro volbu metody Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 42 / 45

43 Perspektivy Dziękujemy za uwagę! Děkujeme za pozornost! Za technickou pomoc vděčíme Tomáši Jelínkovi, Davidu Marečkovi a Haně Skoumalové Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 43 / 45

44 O čem budeme mluvit Literatura 1 Motivace 2 Ruční analýza 3 Předběžné shrnutí 4 Automatická excerpce ekvivalentů 5 Stochastické modelování lexikální ekvivalence 6 Perspektivy 7 Literatura Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 44 / 45

45 Literatura Kaczmarska, E. & Rosen, A. (2013). Między znaczeniem leksykalnym a walencja próba opracowania metody ekstrakcji ekwiwalentów na podstawie korpusu równoległego (Between lexical meaning and valency towards a method for extracting equivalents based on a parallel corpus). Studia z Filologii Polskiej i Słowiańskiej, 48, Oliva, K. (1994). Polsko-český slovník. Academia, Praha. Siatkowski, J. & Basaj, M. (2002). Słownik czesko-polski. Wiedza Powszechna, Warszawa, 2 edition. Kaczmarska, Rosen & Hana (UW & UK) Jak najít optimální překlad polysémních sloves Korpling 45 / 45

Syntakticko sémantický popis vybraných skupin sloves vyjadřujících emoce a pocity. Elżbieta Kaczmarska

Syntakticko sémantický popis vybraných skupin sloves vyjadřujících emoce a pocity. Elżbieta Kaczmarska Syntakticko sémantický popis vybraných skupin sloves vyjadřujících emoce a pocity Syntakticko sémantický popis sloves valenční popis Valencí rozumíme počet argumentů řízených slovesným predikátem spolu

Více

Institut západní a jižní slavistiky. Elżbieta Kaczmarska 2

Institut západní a jižní slavistiky. Elżbieta Kaczmarska 2 Elżbieta Kaczmarska Institut západní a jižní slavistiky Elżbieta Kaczmarska 2 * *jazyk nemateřský *druhý jazyk - v zahraničí a na území ČR (skupiny českých vystěhovalců i jejich potomků - především ve

Více

Jak najít optimální překlad polysémních sloves porovnání metod formální analýzy paralelních textů 1

Jak najít optimální překlad polysémních sloves porovnání metod formální analýzy paralelních textů 1 Elżbieta Kaczmarska Alexandr Rosen ČASOPIS PRO MODERNÍ FILOLOGII 97, 2015, Č. 2, S. 157 168 Jak najít optimální překlad polysémních sloves porovnání metod formální analýzy paralelních textů 1 Elżbieta

Více

Elżbieta Kaczmarska, PhD. Institute of Western and Southern Slavic Studies University of Warsaw

Elżbieta Kaczmarska, PhD. Institute of Western and Southern Slavic Studies University of Warsaw Elżbieta Kaczmarska, PhD Institute of Western and Southern Slavic Studies University of Warsaw In Search of the Meaning of Verbs Expressing Mental States Analysis of Czech Verbs and Their Polish Equivalents

Více

Elżbieta Kaczmarska. Institute of Western and Southern Slavic Studies University of Warsaw

Elżbieta Kaczmarska. Institute of Western and Southern Slavic Studies University of Warsaw Elżbieta Kaczmarska Institute of Western and Southern Slavic Studies University of Warsaw Corpus-based Analysis of Czech Units Expressing Mental States and Their Polish Equivalents Motivation Czech Polish

Více

Institut západní a jižní slavistiky. Elżbieta Kaczmarska 2

Institut západní a jižní slavistiky. Elżbieta Kaczmarska 2 Elżbieta Kaczmarska Institut západní a jižní slavistiky Elżbieta Kaczmarska 2 Problémy s porozuměním a překladem do polštiny? * příbuzné jazyky podobné neznamená stejné + negativní transfer při učení (rušivý

Více

1. Přehled cizojazyčných a vícejazyčných korpusů

1. Přehled cizojazyčných a vícejazyčných korpusů 1. Přehled cizojazyčných a vícejazyčných korpusů typy korpusů a možnosti jejich využití 2. Nová verze korpusu InterCorp (prosinec 2014) nové jazyky a texty lemmatizace a značkování 3. Webové korpusy srovnatelné

Více

Paralelní korpusy. 0/2 Z, zimní semestr 2006/2007. Alexandr Rosen

Paralelní korpusy. 0/2 Z, zimní semestr 2006/2007. Alexandr Rosen Paralelní korpusy 0/2 Z, zimní semestr 2006/2007 Alexandr Rosen Ústav teoretické a komputační lingvistiky Filozofická fakulta Univerzity Karlovy v Praze Alexandr Rosen (ÚTKL FF UK ) Paralelní korpusy 1

Více

ve strojovém překladu

ve strojovém překladu Jaká data se používají ve strojovém překladu Ondřej Bojar bojar@ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky MFF UK ELRC Training Workshop, 15. prosinec 2015 1/39 Osnova Typy dat ve strojovém

Více

Korpusová lingvistika a počítačové zpracování přirozeného jazyka

Korpusová lingvistika a počítačové zpracování přirozeného jazyka Korpusová lingvistika a počítačové zpracování přirozeného jazyka Vladimír Petkevič & Alexandr Rosen Ústav teoretické a komputační lingvistiky Filozofické fakulty Univerzity Karlovy v Praze Korpusový seminář

Více

2. Korpusový portál a volně dostupné nástroje

2. Korpusový portál a volně dostupné nástroje 1. Něco málo o jazykových korpusech co to je a jak se to používá 2. Korpusový portál a volně dostupné nástroje webový portál www.korpus.cz 3. Korpusový nástroj SyD porovnání dvou a více slov z hlediska

Více

KORPUSOVÝ WORKSHOP. Václav Cvrček, Lucie Chlumská. 13. 2. 2013 Univerzita Karlova v Praze VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT!

KORPUSOVÝ WORKSHOP. Václav Cvrček, Lucie Chlumská. 13. 2. 2013 Univerzita Karlova v Praze VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT! KORPUSOVÝ WORKSHOP VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT! Václav Cvrček, Lucie Chlumská 13. 2. 2013 Univerzita Karlova v Praze O (Ú)ČNK Ústav Českého národního korpusu, založen v roce

Více

Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus

Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus David Mareček obhajoba diplomové práce 8. 9. 2008 Motivace Na t-rovině jsou si jazyky podobnější alignment by zde měl být

Více

Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech

Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech Kateřina Veselovská ÚFAL MFF UK veselovska@ufal.mff.cuni.cz

Více

Mgr. Petr Čadek, Mgr. Karel Šulc, Bc. Lukáš Javůrek, Hana Solarová

Mgr. Petr Čadek, Mgr. Karel Šulc, Bc. Lukáš Javůrek, Hana Solarová Mgr. Petr Čadek, Mgr. Karel Šulc, Bc. Lukáš Javůrek, Hana Solarová KOGNITIVNÍ LINGVISTIKA Jazyk a jeho užívání jsou jednou z kognitivních aktivit lidské mysli. Kognitivní lingvisté předpokládají, že jazyk

Více

WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY

WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY Datum konání: 11. dubna 2014 Místo konání: Filozofická fakulta Masarykovy univerzity (učebna G13) Název přednášky: Přednášející: Webové korpusy Aranea

Více

Automatické párování uzlů českých a anglických tektogramatických stromů

Automatické párování uzlů českých a anglických tektogramatických stromů Automatické párování uzlů českých a anglických tektogramatických stromů David Mareček pondělní seminář 13. 10. 2008 Osnova rozdíly mezi párováním na morfologické a na tektogramatické rovině ruční párování

Více

Specializovaný korpus BANÁT a jeho využití

Specializovaný korpus BANÁT a jeho využití Specializovaný korpus BANÁT a jeho využití Klára Dvořáková, Zuzana Komrsková a Karolína Vyskočilová klara.dvorakova@ujc.cas.cz zuzana.komrskova@ff.cuni.cz karolina.vyskocilova@ff.cuni.cz Korpusová lingvistika

Více

Olympiáda v českém jazyce 43. ročník, 2016/2017

Olympiáda v českém jazyce 43. ročník, 2016/2017 Národní institut pro další vzdělávání MŠMT Senovážné náměstí 25, 110 00 Praha 1 Olympiáda v českém jazyce 43. ročník, 2016/2017 krajské kolo zadání II. kategorie Počet bodů:... Jméno:... Škola:... A ještě

Více

Korpusová lingvistika a počítačová lexikografie. Od 60. let 20. st.

Korpusová lingvistika a počítačová lexikografie. Od 60. let 20. st. Korpusová lingvistika a počítačová Od 60. let 20. st. Raná korpusová lingvistika (konec 19. st 50. léta 20. st., Early corpus linguistics) strukturalistická tradice, americký deskriptivismus, metody založené

Více

Olympiáda v českém jazyce 43. ročník, 2016/2017

Olympiáda v českém jazyce 43. ročník, 2016/2017 Národní institut pro další vzdělávání MŠMT Senovážné náměstí 25, 110 00 Praha 1 Olympiáda v českém jazyce 43. ročník, 2016/2017 krajské kolo řešení I. kategorie 1. Příklady řešení: a) Bojí se ho jako čert

Více

Korpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105

Korpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105 Korpusová lingvistika 2 Mgr. Dana Hlaváčková, Ph.D. CJBB105 Vývoj korpusové lingvistiky raná korpusová lingvistika, počítačová lexikografie, frekvenční studie (90. léta 19. st. 50. léta 20. st.) předěl

Více

Práce s lexikálním materiálem a možnosti exemplifikace v lexikální databázi LEXIKON 21 1

Práce s lexikálním materiálem a možnosti exemplifikace v lexikální databázi LEXIKON 21 1 e.opavská-štěpánková/33-40/8 6.2.2009 21:59 Stránka 33 Práce s lexikálním materiálem a možnosti exemplifikace v lexikální databázi LEXIKON 21 1 Ústav pro jazyk český AV ČR, v. v. i. Working with Lexical

Více

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti. Přednáška č. 1 Úvod do statistiky a počtu pravděpodobnosti Statistika Statistika je věda a postup jak rozvíjet lidské znalosti použitím empirických dat. Je založena na matematické statistice, která je

Více

Průzkum paralelních dvojjazyčných textů v otázce určení autorství staročeského překladu

Průzkum paralelních dvojjazyčných textů v otázce určení autorství staročeského překladu Průzkum paralelních dvojjazyčných textů v otázce určení autorství staročeského překladu Markéta Pytlíková Lingvistika Praha 2014 11. 4. 2014 ÚJČ AV ČR pytlikova@ujc.cas.cz Atribuce překladového textu Atribuce

Více

ROMÁNSKÉ JAZYKY A ČEŠTINA VE SVĚTLE PARALELNÍCH KORPUSŮ

ROMÁNSKÉ JAZYKY A ČEŠTINA VE SVĚTLE PARALELNÍCH KORPUSŮ ROMÁNSKÉ JAZYKY A ČEŠTINA VE SVĚTLE PARALELNÍCH KORPUSŮ obálka PETR ČERMÁK OLGA NÁDVORNÍKOVÁ ET ALII KAROLINUM Románské jazyky a čeština ve světle paralelních korpusů Petr Čermák, Olga Nádvorníková et

Více

Korpus fikčních narativů

Korpus fikčních narativů 1 Korpus fikčních narativů prózy z 20. let Dvojí domov (1926) Vigilie (1928) Zeměžluč oddíl (1931) Letnice (1932) prózy z 30. let Děravý plášť (1934) Hranice stínu (1935) Modrá a zlatá (1938) Tvář pod

Více

Zápis morfologických dat návrh řešení pro lexikální databázi LEXIKON 21 1

Zápis morfologických dat návrh řešení pro lexikální databázi LEXIKON 21 1 f.voborská/41-46/6 6.2.2009 21:56 Stránka 41 Zápis morfologických dat návrh řešení pro lexikální databázi LEXIKON 21 1 Ústav pro jazyk český AV ČR, v. v. i. Tools for Inputting Morphological Data A Proposal

Více

Automatické vyhledávání informace a znalosti v elektronických textových datech

Automatické vyhledávání informace a znalosti v elektronických textových datech Automatické vyhledávání informace a znalosti v elektronických textových datech Jan Žižka Ústav informatiky & SoNet RC PEF, Mendelova universita Brno (Text Mining) Data, informace, znalost Elektronická

Více

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.

Více

Faktorované překladové modely. Základní informace

Faktorované překladové modely. Základní informace Základní informace statistická metoda překladu statistická metoda překladu založena na frázích (nikoliv slovo slovo) statistická metoda překladu založena na frázích (nikoliv slovo slovo) doplňková informace

Více

Možnosti využití korpusu InterCorp v česko-polské překladové lexikografii

Možnosti využití korpusu InterCorp v česko-polské překladové lexikografii ČASOPIS PRO MODERNÍ FILOLOGII 100, 2018, č. 2, S. 206 222 Možnosti využití korpusu InterCorp v česko-polské překladové lexikografii Andrzej Charciarek (Katowice, Polsko) APPLICATIONS OF THE INTERCORP PARALLEL

Více

Workshop o paralelním korpusu InterCorp

Workshop o paralelním korpusu InterCorp Workshop o paralelním korpusu InterCorp Praha, 6.9.2013 Olga Richterová, ÚČNK Český národní korpus (LM2011023; 2012-2016) Ministerstvo školství, mládeže a tělovýchovy Projekty velkých infrastruktur pro

Více

VALENČNÍ SLOVNÍK ČESKÝCH SUBSTANTIV: VÝCHODISKA A CÍLE

VALENČNÍ SLOVNÍK ČESKÝCH SUBSTANTIV: VÝCHODISKA A CÍLE VALENČNÍ SLOVNÍK ČESKÝCH SUBSTANTIV: VÝCHODISKA A CÍLE Veronika Kolářová, Jana Klímová, Anna Vernerová Ústav formální a aplikované lingvistiky MFF UK Praha 22. 4. 2016 Slovanská lexikografie počátkem 21.

Více

ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE

ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE Mgr. Barbora Štindlová, Ph. D., Mgr. Veronika Čurdová, Mgr. Petra Klimešová, Mgr. Eva Levorová ÚJOP UK, Praha Práce s chybou, Poděbrady

Více

Větná polarita v češtině. Kateřina Veselovská Žďárek Hořovice,

Větná polarita v češtině. Kateřina Veselovská Žďárek Hořovice, Větná polarita v češtině Kateřina Veselovská Žďárek Hořovice, 27. 11. 2009 1 Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání

Více

Detekce interakčních sil v proudu vozidel

Detekce interakčních sil v proudu vozidel Detekce interakčních sil v proudu vozidel (ANEB OBECNĚJŠÍ POHLED NA POJEM VZDÁLENOSTI V MATEMATICE) Doc. Mgr. Milan Krbálek, Ph.D. Katedra matematiky Fakulta jaderná a fyzikálně inženýrská České vysoké

Více

KAM SE ZTRATILI VOLIČI?

KAM SE ZTRATILI VOLIČI? KAM SE ZTRATILI VOLIČI? Vysvětlení vývoje volební účasti v České republice v letech 1990-2010 LUKÁŠ LINEK CENTRUM PRO STUDIUM DEMOKRACIE A KULTURY OBSAH PODĚKOVÁNÍ 5 1. ÚVOD: VOLEBNÍ ÚČAST, JEJÍ POKLES

Více

PLIN041 Vývoj počítačové lingvistiky. Korpusová lingvistika v ČR Počítačová lingvistika v ČR Brno. Mgr. Dana Hlaváčková, Ph.D.

PLIN041 Vývoj počítačové lingvistiky. Korpusová lingvistika v ČR Počítačová lingvistika v ČR Brno. Mgr. Dana Hlaváčková, Ph.D. PLIN041 Vývoj počítačové lingvistiky Korpusová lingvistika v ČR Počítačová lingvistika v ČR Brno Mgr. Dana Hlaváčková, Ph.D. Korpusová lingvistika v ČR lexikografické počátky 1988 Iniciativní skupina pro

Více

Proszę pana/proszę pani Prozsę pana /pani, państwa. Proszę. Proszę bardzo.

Proszę pana/proszę pani Prozsę pana /pani, państwa. Proszę. Proszę bardzo. Obraty společenského styku Zwroty konwersacyjne Pozdravy Dobré jitro, Dobrý den Dobrý večer Nazdar/Ahoj Na shledanou Dobrou noc Pozdrowienia Dzień dobry Dobry wieczór Cześć/Serwus Do widzenia/do zobaczenia

Více

Problematika neúspěšných ukončení vysokoškolského studia (drop-outs) v českém kontextu

Problematika neúspěšných ukončení vysokoškolského studia (drop-outs) v českém kontextu Problematika neúspěšných ukončení vysokoškolského studia (drop-outs) v českém kontextu Jan Hraba, Vladimír Hulík (MŠMT, oddělení analytické) Klára Hulíková Tesárková (PřF UK, katedra demografie a geodemografie)

Více

Eva Lehečková 28. workshop Ţďárek Litoměřice

Eva Lehečková 28. workshop Ţďárek Litoměřice Eva Lehečková (eva.leheckova@ff.cuni.cz) 28. workshop Ţďárek Litoměřice 14. 5. 2011 1 1. Téma 2. Kontext (Korpus DEAF), termíny, problémy 3. Syntax CN kvalitativní sonda 2 V psané češtině českých neslyšících

Více

Počítačová lingvistika v praxi Pavel Ševeček, Tomáš Pavelek

Počítačová lingvistika v praxi Pavel Ševeček, Tomáš Pavelek Počítačová lingvistika v praxi Pavel Ševeček, Tomáš Pavelek I. Zpracování textu II. III. IV. Jazyk G Desambiguace Kontrola gramatiky V. Kontrola stylu VI. Valence sloves VII. Vývoj a odezva I. Zpracování

Více

Národní institut pro další vzdělávání MŠMT Senovážné náměstí 25, Praha 1

Národní institut pro další vzdělávání MŠMT Senovážné náměstí 25, Praha 1 Národní institut pro další vzdělávání MŠMT Senovážné náměstí 25, 110 00 Praha 1 Olympiáda v českém jazyce, 42. ročník, 2015/2016 krajské kolo I. kategorie Počet bodů:... Příjemní a jméno:... Škola:...

Více

Dolování z textu. Martin Vítek

Dolování z textu. Martin Vítek Dolování z textu Martin Vítek Proč dolovat z textu Obrovské množství materiálu v nestrukturované textové podobě knihy časopisy vědeckéčlánky sborníky konferencí internetové diskuse Proč dolovat z textu

Více

Inovace studia obecné jazykovědy a teorie komunikace ve spolupráci s přírodními vědami. reg. č.: CZ.1.07/2.2.00/

Inovace studia obecné jazykovědy a teorie komunikace ve spolupráci s přírodními vědami. reg. č.: CZ.1.07/2.2.00/ Inovace studia obecné jazykovědy a teorie komunikace ve spolupráci s přírodními vědami reg. č.: CZ.1.07/2.2.00/28.0076 Úvod do kvantitativní lingvistiky Radek Čech Kvantitativní lingvistika co Vás napadne,

Více

Shoda u českých složených základních číslovek obsahujících číslovku jeden

Shoda u českých složených základních číslovek obsahujících číslovku jeden Shoda u českých složených základních číslovek obsahujících číslovku jeden Ivona Turinská, FF UK Žďárek 2009 Sto jeden žák, či sto jedna žáků? Shoda mezi složeným číslovkovým výrazem (SČV) a počítaným předmětem

Více

Počítačové zpracování češtiny. Kontrola pravopisu. Daniel Zeman

Počítačové zpracování češtiny. Kontrola pravopisu. Daniel Zeman Počítačové zpracování češtiny Kontrola pravopisu Daniel Zeman http://ufal.mff.cuni.cz/daniel-zeman/ Úloha Rozpoznat slovo, které není ve slovníku Triviální Těžší je rozpoznat slovo, které ve slovníku je,

Více

Automatické vytváření slovníků z paralelních korpusů

Automatické vytváření slovníků z paralelních korpusů Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Jan Popelka Automatické vytváření slovníků z paralelních korpusů Ústav formální a aplikované lingvistiky Vedoucí diplomové práce:

Více

Jak na paralelní texty s programem ParaConc

Jak na paralelní texty s programem ParaConc Jak na paralelní texty s programem ParaConc verze 0.3 Alexandr Rosen alexandr.rosen@ff.cuni.cz 14. dubna 2005 1 ParaConc základní údaje program pro vytváření a prohlížení paralelních korpusů pro systém

Více

Databáze překladových ekvivalentů Treq 1

Databáze překladových ekvivalentů Treq 1 ČASOPIS PRO MODERNÍ FILOLOGII 99, 2017, Č. 2, S. 245 260 Databáze překladových ekvivalentů Treq 1 Michal Škrabal (Praha) Martin Vavřín (Praha) THE TRANSLATION EQUIVALENTS DATABASE (TREQ) The aim of the

Více

IA161 Pokročilé techniky zpracování přirozeného jazyka

IA161 Pokročilé techniky zpracování přirozeného jazyka IA161 Pokročilé techniky zpracování přirozeného jazyka Strojový překlad Vít Baisa Překlad angličtina čeština Moses is an implementation of the statistical (or data-driven) approach to machine translation

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

Depfix: Jak dělat strojový překlad lépe než Google Translate

Depfix: Jak dělat strojový překlad lépe než Google Translate Rudolf Rosa rur@nikdeeu http://ufalmffcunicz/rudolf-rosa Depfix: Jak dělat strojový překlad lépe než Google Translate Univerzita Karlova v Praze Matematicko-fyzikální fakulta Ústav formální a aplikované

Více

NLP & strojové učení

NLP & strojové učení NLP & strojové učení Miloslav Konopík 2. dubna 2013 1 Úvodní informace 2 Jak na to? Miloslav Konopík () NLP & strojové učení 2. dubna 2013 1 / 13 Co je to NLP? NLP = Natural Language Processing (zpracování

Více

Kolísání rodu substantiv

Kolísání rodu substantiv Kolísání rodu substantiv Alena Poncarová alena.poncarova@gmail.com Ţďárek duben 2012 Ţďárek Proč se zabývám jmenným rodem Jmenný rod jako takový Kolísání v širokém slova smyslu Některé problémy bádání

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Aplikace bodových procesů při analýze veřejné správy

Aplikace bodových procesů při analýze veřejné správy Aplikace bodových procesů při analýze veřejné správy Radka Lechnerová Soukromá vysoká škola ekonomických studií, s.r.o. Katedra matematiky a IT Tomáš Lechner Vysoká škola ekonomická v Praze, Národohospodářská

Více

Překladač a jeho struktura

Překladač a jeho struktura Překladač a jeho struktura Překladače, přednáška č. 1 Šárka Vavrečková Ústav informatiky, FPF SU Opava sarka.vavreckova@fpf.slu.cz http://fpf.slu.cz/ vav10ui Poslední aktualizace: 23. září 2008 Definice

Více

Český jazyk a literatura

Český jazyk a literatura Český jazyk a literatura 9. ročník Výstupy ŠVP Učivo Přesahy, metody a průřezová témata Žák KOMUNIKAČNÍ A SLOHOVÁ VÝCHOVA směřuje k vytříbenému ústnímu i písemnému projevu,uspořádání vybraných jazykových

Více

Metody analýzy modelů. Radek Pelánek

Metody analýzy modelů. Radek Pelánek Metody analýzy modelů Radek Pelánek Fáze modelování 1 Formulace problému 2 Základní návrh modelu 3 Budování modelu 4 Verifikace a validace 5 Simulace a analýza 6 Sumarizace výsledků Simulace a analýza

Více

Automatická post-editace výstupů frázového strojového překladu (Depfix)

Automatická post-editace výstupů frázového strojového překladu (Depfix) Rudolf Rosa diplomová práce Automatická post-editace výstupů frázového strojového překladu (Depfix) Automatic post-editing of phrase-based machine translation outputs Motivační příklad Zdroj (WMT 2010):

Více

ÚSTAV ROMÁNSKÝCH STUDIÍ. Oddělení italianistiky urs.ff.cuni.cz Den otevřených dveří FF UK 11. 1. 2014

ÚSTAV ROMÁNSKÝCH STUDIÍ. Oddělení italianistiky urs.ff.cuni.cz Den otevřených dveří FF UK 11. 1. 2014 ÚSTAV ROMÁNSKÝCH STUDIÍ Oddělení italianistiky urs.ff.cuni.cz Den otevřených dveří FF UK 11. 1. 2014 KDO JSME Oddělení italianistiky součástí Ústavu románských studií (ÚRS) Realizuje výuku stud. programu

Více

Formální úprava bakalářských a diplomových prací Univerzita Karlova, Husitská teologická fakulta

Formální úprava bakalářských a diplomových prací Univerzita Karlova, Husitská teologická fakulta Formální úprava bakalářských a diplomových prací Univerzita Karlova, Husitská teologická fakulta Odevzdání práce Bakalářské a diplomové práce se odevzdávají prostřednictvím webového rozhraní SIS na adrese

Více

0. Úvod. 1. Syntaktické značkování textu

0. Úvod. 1. Syntaktické značkování textu Systém pro syntaktické značkování velkých textových korpusů 1 Tomáš Jelínek Ústav teoretické a komputační lingvistiky Filozofické fakulty Karlovy univerzity Abstract Syntactic annotation of corpora is

Více

Present simple (přítomný čas prostý)

Present simple (přítomný čas prostý) Present simple (přítomný čas prostý) MASARYKOVA ZÁKLADNÍ ŠKOLA A MATEŘSKÁ ŠKOLA VELKÁ BYSTŘICE projekt č. CZ.1.07/1.4.00/21.1920 Název projektu: Učení pro život Číslo DUMu: VY_32_INOVACE_11_12 Tématický

Více

Výroková a predikátová logika - VIII

Výroková a predikátová logika - VIII Výroková a predikátová logika - VIII Petr Gregor KTIML MFF UK ZS 2017/2018 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - VIII ZS 2017/2018 1 / 21 Tablo Tablo metoda v PL - rozdíly Formule

Více

Slavnost Ježíše Krista Krále. Cyklus B Mt 25,31-46

Slavnost Ježíše Krista Krále. Cyklus B Mt 25,31-46 Slavnost Ježíše Krista Krále Cyklus B Mt 25,31-46 Má sílo Má sílo, k Tobě vzhlížím, má sílo Tobě zpívám, neboť ty Bože jsi útočiště mé. Pane můj, lásko má, Ty Bože jsi útočiště mé. Pane smiluj se Čtení

Více

coachpage.cz MARKETINGOVÝ VÝZKUM Faktory ovlivňující nákupní chování ve vztahu ke koupi automobilu TOOLS for SUCCESS in TODAY s BUSINESS

coachpage.cz MARKETINGOVÝ VÝZKUM Faktory ovlivňující nákupní chování ve vztahu ke koupi automobilu TOOLS for SUCCESS in TODAY s BUSINESS coachpage.cz TOOLS for SUCCESS in TODAY s BUSINESS MARKETINGOVÝ VÝZKUM Faktory ovlivňující nákupní chování Faktory ovlivňující nákupní chování Hlavní cíl výzkumného projektu Výzkumný projekt si klade za

Více

Studentské hodnocení výuky

Studentské hodnocení výuky Studentské hodnocení výuky Obecné otázky Jan Kříž, David Hurný, Markéta Martínková Studentská komora Akademického senátu PřF studijní proděkanka Proč dělat SHV 1. Vyžaduje to legislativa 2. Zvýšení kvality

Více

Institut teoretické informatiky (ITI) na FI MU

Institut teoretické informatiky (ITI) na FI MU Institut teoretické informatiky (ITI) na FI MU Antonín Kučera (vedoucí) Petr Hliněný, Jan Obdržálek, Vojtěch Řehák Fakulta informatiky, Masarykova Univerzita, Brno Brno, 28. dubna 2011 J. Obdržálek (FI

Více

E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO

E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO Seznam výukových materiálů III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Tematická oblast: Předmět: Vytvořil: Současný český jazyk upevňování a procvičování obtížných gramatických jevů Český jazyk

Více

Mezinárodní vědecká konference. Proměny polonistiky. Tradice a výzvy polonistických studií. Praha 6. 7. 11. 2013

Mezinárodní vědecká konference. Proměny polonistiky. Tradice a výzvy polonistických studií. Praha 6. 7. 11. 2013 Mezinárodní vědecká konference Proměny polonistiky. Tradice a výzvy polonistických studií Praha 6. 7. 11. 2013 Konference se koná pod záštitou: J. E. Grażyny Bernatowicz, velvyslankyně Polské republiky

Více

ČASOPIS PRO MODERNÍ FILOLOGII 99, 2017, Č. 1, S

ČASOPIS PRO MODERNÍ FILOLOGII 99, 2017, Č. 1, S ČASOPIS PRO MODERNÍ FILOLOGII 99, 2017, Č. 1, S. 131 146 MARKÉTA LOPATKOVÁ A KOL.: VALENČNÍ SLOVNÍK ČESKÝCH SLOVES VALLEX Druhé vydání, přepracované a rozšířené Praha: Karolinum, 2016, 698 stran ISBN 978-80-246-3542-2

Více

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Anglický jazyk Ročník: 5. Průřezová témata Mezipředmětové vztahy.

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Anglický jazyk Ročník: 5. Průřezová témata Mezipředmětové vztahy. Ročník: 5. OSV - rozvoj individuálních dovedností pro kooperaci (seberegulace v situaci nesouhlasu, odporu apod., dovednost odstoupit od vlastního nápadu, dovednost navazovat na druhé a rozvíjet vlastní

Více

1. Statistická analýza dat Jak vznikají informace Rozložení dat

1. Statistická analýza dat Jak vznikají informace Rozložení dat 1. Statistická analýza dat Jak vznikají informace Rozložení dat J. Jarkovský, L. Dušek, S. Littnerová, J. Kalina Význam statistické analýzy dat Sběr a vyhodnocování dat je způsobem k uchopení a pochopení

Více

PŘÍČINY VZNIKU BEZDOMOVSTVÍ U MLADÝCH LIDÍ. Ústí nad Labem Mgr. Ilja Hradecký

PŘÍČINY VZNIKU BEZDOMOVSTVÍ U MLADÝCH LIDÍ. Ústí nad Labem Mgr. Ilja Hradecký PŘÍČINY VZNIKU BEZDOMOVSTVÍ U MLADÝCH LIDÍ Ústí nad Labem 5.11.2014 Mgr. Ilja Hradecký PŘEHLED Souvislosti Současný rámec Struktura péče a související problémy Počty chovanců a jejich struktura Výstup

Více

Didaktický test Na co se mě vlastně ptají?

Didaktický test Na co se mě vlastně ptají? Didaktický test Na co se mě vlastně ptají? Základní slovníček: SPRÁVNĚ x CHYBNĚ JE PRAVDIVÉ x NENÍ PRAVDIVÉ (správný tvar) (chybný tvar, chyba) Styly písma: KURZIVA (vyznačeno kurzivou) TUČNĚ vyznačená

Více

Česká předložka s/se a její anglické ekvivalenty

Česká předložka s/se a její anglické ekvivalenty Česká předložka s/se a její anglické ekvivalenty Renata Novotná Ústav Českého národního korpusu Workshop Intercorp 6. září 2013 Předložka s a její frekvence Frekvenční slovník češtiny (2004) - třetí nejfrekventovanější

Více

LEXIKÁLNĚ- -SÉMANTICKÉ KONVERZE VE VALENČNÍM SLOVNÍKU

LEXIKÁLNĚ- -SÉMANTICKÉ KONVERZE VE VALENČNÍM SLOVNÍKU LEXIKÁLNĚ- -SÉMANTICKÉ KONVERZE VE VALENČNÍM SLOVNÍKU VÁCLAVA KETTNEROVÁ KAROLINUM Lexikálně-sémantické konverze ve valenčním slovníku Mgr. Václava Kettnerová, Ph.D. Recenzovali: prof. PhDr. Petr Karlík,

Více

Jazykové technologie. Karel Oliva Ústav pro jazyk český Akademie věd ČR

Jazykové technologie. Karel Oliva Ústav pro jazyk český Akademie věd ČR Jazykové technologie Karel Oliva Ústav pro jazyk český Akademie věd ČR Změněná situace jazyka jakožto komunikačního prostředku komunikace mezi lidmi (navzájem) komunikace mezi lidmi a stroji => změna schopnosti

Více

Stonožka jak se z výsledků dozvědět co nejvíce

Stonožka jak se z výsledků dozvědět co nejvíce Stonožka jak se z výsledků dozvědět co nejvíce Vytvoření Map učebního pokroku umožňuje vyhodnotit v testování Stonožka i dílčí oblasti učiva. Mapy učebního pokroku sledují individuální pokrok žáka a nabízejí

Více

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013 Workshop k terminologickým otázkám organizace znalostí 29. 10. 2014 Součást řešení projektu Programu aplikovaného výzkumu a vývoje národní a kulturní identity (NAKI) DF13P01OVV013 2013 2015 Helena Kučerová,

Více

STUDIJNÍ OPORA K DISCIPLÍNĚ KORPUSOVÁ LINGVISTIKA. Katedra českého jazyka a literatury Pedagogické fakulty Univerzity Palackého

STUDIJNÍ OPORA K DISCIPLÍNĚ KORPUSOVÁ LINGVISTIKA. Katedra českého jazyka a literatury Pedagogické fakulty Univerzity Palackého STUDIJNÍ OPORA K DISCIPLÍNĚ KORPUSOVÁ LINGVISTIKA Katedra českého jazyka a literatury Pedagogické fakulty Univerzity Palackého Počet kreditů: 1 Typ předmětu: volitelný Způsob zakončení: zápočet Garant

Více

Uvod Modely n-tic Vyhodnocov an ı Vyhlazov an ı a stahov an ı Rozˇ s ıˇ ren ı model u n-tic Jazykov e modelov an ı Pavel Smrˇ z 27.

Uvod Modely n-tic Vyhodnocov an ı Vyhlazov an ı a stahov an ı Rozˇ s ıˇ ren ı model u n-tic Jazykov e modelov an ı Pavel Smrˇ z 27. Jazykové modelování Pavel Smrž 27. listopadu 2006 Osnova 1 Úvod motivace, základní pojmy 2 Modely n-tic 3 Způsob vyhodnocování 4 Vyhlazování a stahování 5 Rozšíření modelů n-tic 6 Lingvisticky motivované

Více

ANOTACE K VÝUKOVÉ SADĚ

ANOTACE K VÝUKOVÉ SADĚ Číslo projektu Číslo a název šablony klíčové aktivity Tematická oblast (předmět) Autor ANOTACE K VÝUKOVÉ SADĚ CZ.1.07/1.5.00/34.0705 III/2 Inovace a zkvalitnění výuky prostřednictvím ICT SLOVESA (ANGLICKÝ

Více

Na Maninách 38,170 00 Praha7

Na Maninách 38,170 00 Praha7 Na Maninách 38,170 00 Praha7 REMEDIUM Praha společně s ČESKÝM INSTITUTEM PRO SUPERVIZI pořádalo 20. listopadu 2008 (14.00-18.00) v prostorách REMEDIA PRAHA, Křišťanova 15, Praha 3 workshop s tématem: T

Více

Karel Pala, Vít Suchomel

Karel Pala, Vít Suchomel PA153 Počítačové zpracování přirozeného jazyka 06 Korpusy a korpusové nástroje, značkování Karel Pala, Vít Suchomel Centrum ZPJ, FI MU, Brno 21. října 2013 Karel Pala, Vít Suchomel PA153 Zpracování přirozeného

Více

Gramatika. Přítomný čas prostý a průběhový. Minulý čas prostý pravidelných i nepravidelných sloves. Počitatelná a nepočitatelná podstatná jména

Gramatika. Přítomný čas prostý a průběhový. Minulý čas prostý pravidelných i nepravidelných sloves. Počitatelná a nepočitatelná podstatná jména A B C D E F 1 Vzdělávací oblast: Jazyk a jazyková komunikace 2 Vzdělávací obor: Cizí jazyk 3 Vzdělávací předmět Anglický jazyk 4 Ročník: 7. 5 Klíčové kompetence Průřezová témata Výstupy Učivo (Dílčí kompetence)

Více

SYNTAX LS Úvod

SYNTAX LS Úvod SYNTAX LS 2017 Úvod Co očekáváte od předmětu? viz sylabus požadavky Literatura Nový encyklopedický slovník češtiny https://www.czechency.org/ Panevová a kol. (2014) Mluvnice současné češtiny 2. http://www.cupress.cuni.cz/ink2_ext/index.jsp?

Více

Výroková a predikátová logika - IV

Výroková a predikátová logika - IV Výroková a predikátová logika - IV Petr Gregor KTIML MFF UK ZS 2018/2019 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - IV ZS 2018/2019 1 / 17 Tablo metoda Tablo Tablo - příklady F (((p q)

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

Strojové učení a pravidla pro extrakci informací z textů

Strojové učení a pravidla pro extrakci informací z textů Strojové učení a pravidla pro extrakci informací z textů Barbora Hladká Ústav formální a aplikované lingvistiky MFF UK http://ufal.mff.cuni.cz Machine Learning Meetups, 2. prosince 2015 Pozvánka Jako výzkumníci

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Itálie Dotazník pro učitele VŠ připravující budoucí učitele cizích jazyků Zpracování údajů

Itálie Dotazník pro učitele VŠ připravující budoucí učitele cizích jazyků Zpracování údajů Itálie Dotazník pro učitele VŠ připravující budoucí učitele cizích jazyků Zpracování údajů O Vás 1. Dotazník vyplnilo sedm vysokoškolských pedagogů připravujících budoucí učitele cizích jazyků. 2. Šest

Více

ÚSTAV ROMÁNSKÝCH STUDIÍ ODDĚLENÍ ITALIANISTIKY URS.FF.CUNI.CZ

ÚSTAV ROMÁNSKÝCH STUDIÍ ODDĚLENÍ ITALIANISTIKY URS.FF.CUNI.CZ ÚSTAV ROMÁNSKÝCH STUDIÍ ODDĚLENÍ ITALIANISTIKY URS.FF.CUNI.CZ Den otevřených dveří 14. ledna 2017 KDO JSME Oddělení italianistiky součástí Ústavu románských studií (ÚRS) Realizuje výuku stud. programu

Více

Výroková a predikátová logika - IX

Výroková a predikátová logika - IX Výroková a predikátová logika - IX Petr Gregor KTIML MFF UK ZS 2018/2019 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - IX ZS 2018/2019 1 / 13 Dokončené tablo Chceme, aby dokončená bezesporná

Více

Olympiáda v českém jazyce 45. ročník, 2018/2019

Olympiáda v českém jazyce 45. ročník, 2018/2019 Národní institut pro další vzdělávání MŠMT Senovážné náměstí 25, 110 00 Praha 1 Olympiáda v českém jazyce 45. ročník, 2018/2019 Krajské kolo zadání II. kategorie přidělené soutěžní číslo body gramatika

Více

Ontologie. Otakar Trunda

Ontologie. Otakar Trunda Ontologie Otakar Trunda Definice Mnoho různých definic: Formální specifikace sdílené konceptualizace Hierarchicky strukturovaná množina termínů popisujících určitou věcnou oblast Strukturovaná slovní zásoba

Více