Automatická post-editace výstupů frázového strojového překladu (Depfix)

Rozměr: px
Začít zobrazení ze stránky:

Download "Automatická post-editace výstupů frázového strojového překladu (Depfix)"

Transkript

1 Rudolf Rosa diplomová práce Automatická post-editace výstupů frázového strojového překladu (Depfix) Automatic post-editing of phrase-based machine translation outputs

2 Motivační příklad Zdroj: All the winners received a diploma Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 2/42

3 Motivační příklad Zdroj: All the winners received a diploma Co nám dá Moses? Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 3/42

4 Motivační příklad Zdroj: All the winners received a diploma Co nám dá Moses? Všem výhercům obdržel diplom Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 4/42

5 Motivační příklad Zdroj: All the winners received a diploma Co nám dá Moses? Všem výhercům obdržel diplom Co by se nám líbilo více? Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 5/42

6 Motivační příklad Zdroj: All the winners received a diploma Co nám dá Moses? Všem výhercům obdržel diplom Co by se nám líbilo více? Všichni výherci obdrželi diplom Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 6/42

7 Motivační příklad Zdroj: All the winners received a diploma Co nám dá Moses? Všem výhercům obdržel diplom Co na to Depfix? Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 7/42

8 Motivační příklad Zdroj: All the winners received a diploma Co nám dá Moses? Všem výhercům obdržel diplom Co na to Depfix? vezme zdrojovou větu a výstup Mosese Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 8/42

9 Motivační příklad Zdroj: All the winners received a diploma Co nám dá Moses? Všem výhercům obdržel diplom Co na to Depfix? vezme zdrojovou větu a výstup Mosese najde chyby Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 9/42

10 Motivační příklad Zdroj: All the winners received a diploma Co nám dá Moses? Všem výhercům obdržel diplom Co na to Depfix? vezme zdrojovou větu a výstup Mosese najde chyby, opraví je, a vydá správný překlad Všichni výherci obdrželi diplom Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 10/42

11 Obsah Motivační příklad Depfix krok za krokem Úpravy použitých nástrojů Vyhodnocení Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 11/42

12 Depfix krok za krokem Lingvistická analýza vstupu Roviny dle Pražského závislostního korpusu M-rovina A-rovina T-rovina Pravidlové a statistické opravy chyb Implementováno ve frameworku Treex Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 12/42

13 M-rovina Analýza: lemmata, tagy, word-alignment Opravy: vokalizace předložek kapitalizace Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 13/42

14 A-rovina Analýza: závislostní stromy, analytické funkce Opravy: morfologické shody: předložka se substantivem, podmět s přísudkem, substantivum s adjektivem transfer významu do morfologie: podmět, přivlastňování, pasivum Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 14/42

15 Všem výhercům obdržel diplom zone=en zone=cs received VBD obdržel VpYSXRA Z: winners Sb NNS diploma NN výhercům NNMP3 diplom NNIS1 All P the a Všem PLXP3

16 Transfer významu: podmět zone=en zone=cs received VBD obdržel VpYSXRA Z: winners Sb NNS diploma NN výhercům NNMP3 diplom NNIS1 All P the a Všem PLXP3

17 Transfer významu: podmět zone=en zone=cs received VBD obdržel VpYSXRA Z: winners Sb NNS diploma NN výhercům NNMP3 diplom NNIS1 All P the a Všem PLXP3

18 Podmět nominativ zone=en zone=cs received VBD obdržel VpYSXRA Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All P the a Všem PLXP3

19 Všem výherci obdržel diplom zone=en zone=cs received VBD obdržel VpYSXRA Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All P the a Všem PLXP3

20 Shoda adjektiva se substantivem zone=en zone=cs received VBD obdržel VpYSXRA Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All P the a Všem PLXP3

21 Shoda: rod, pád (číslo) zone=en zone=cs received VBD obdržel VpYSXRA Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All P the a Všichni PLMP1

22 Všichni výherci obdržel diplom zone=en zone=cs received VBD obdržel VpYSXRA Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All P the a Všichni PLMP1

23 Shoda podmětu s přísudkem zone=en zone=cs received VBD obdržel VpYSXRA Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All P the a Všichni PLMP1

24 Shoda: rod, číslo (osoba) zone=en zone=cs received VBD obdrželi VpMPXRA Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All P the a Všichni PLMP1

25 Všichni výherci obdrželi diplom zone=en zone=cs received VBD obdrželi VpMPXRA Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All P the a Všichni PLMP1

26 A-rovina Analýza: závislostní stromy, analytické funkce Opravy: morfologické shody: předložka se substantivem, podmět s přísudkem, substantivum s adjektivem transfer významu do morfologie: podmět, přivlastňování, pasivum Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 26/42

27 T-rovina Analýza: t-stromy, formémy, gramatémy Opravy: pravidlové: negace, překlad slovesných časů, vypouštění pronominálního podmětu statistické: substantivní a verbální valence Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 27/42

28 Valenční model natrénováno na CzEngu pravděpodobnost formému argumentu podmíněná lemmatem rodiče (sloveso/substantivum) formémem anglického argumentu ± lemmatem argumentu Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 28/42

29 Úpravy použitých nástrojů nástroje pro automatickou analýzu jazyka tagger, word-aligner, parser určené pro analýzu bezchybných vět výstupy strojového překladu obsahují chyby nátroje mají při jejich analýze nižší úspěšnost zvýšení robustnosti nástrojů pravidlové opravy výstupů (tagger, aligner, parser) reimplementace a modifikace parseru (pro češtinu) Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 29/42

30 Maximum Spanning Tree parser McDonald, Crammer, Pereira (2005) Online large-margin training of dependency parsers Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 30/42

31 Maximum Spanning Tree parser McDonald, Crammer, Pereira (2005) Online large-margin training of dependency parsers Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 31/42

32 Maximum Spanning Tree parser McDonald, Crammer, Pereira (2005) Online large-margin training of dependency parsers McDonald, Pereira, Rybarov, Hajič (2006) Non-projective dependency parsing using spanning tree algorithms Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 32/42

33 Maximum Spanning Tree parser reimplementace, vyladění pro češtinu Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 33/42

34 Maximum Spanning Tree parser reimplementace, vyladění pro češtinu zhoršení trénovacích dat zavlečení chyb podle chybového modelu, natrénovaného na výstupech Mosese Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 34/42

35 Maximum Spanning Tree parser reimplementace, vyladění pro češtinu zhoršení trénovacích dat zavlečení chyb podle chybového modelu, natrénovaného na výstupech Mosese přidání informací o zdrojové větě tag, analytická funkce, existence hrany Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 35/42

36 Maximum Spanning Tree parser reimplementace, vyladění pro češtinu zhoršení trénovacích dat zavlečení chyb podle chybového modelu, natrénovaného na výstupech Mosese přidání informací o zdrojové větě tag, analytická funkce, existence hrany přidání informací z velkého korpusu (CzEng) PMI rodič, potomek =log p[ rodič, potomek ] p[rodič,*] p[*, potomek] Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 36/42

37 Manuální vyhodnocení Depfixu Vyhodnoceno Změněno 1350 vět 739 vět Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 37/42

38 Manuální vyhodnocení Depfixu Vyhodnoceno Změněno Zlepšeno Zhoršeno Neurčeno 1350 vět 739 vět 430 vět 152 vět 157 vět Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 38/42

39 Manuální vyhodnocení Depfixu Vyhodnoceno 1350 vět Změněno 739 vět Zlepšeno 430 vět Zhoršeno 152 vět Neurčeno 157 vět Úspěšnost 58,2% Přesnost 73,9% Úplnost 31,9% úspěšnost = zlepšeno změněno přesnost = úplnost = zlepšeno zlepšeno zhoršeno zlepšeno vyhodnoceno Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 39/42

40 Automatické vyhodnocení (BLEU) Systém WMT 2011 WMT 2012 před po před po Joshua (Zeman) 14,08 14,81 12,10 12,44 Moses (Bojar) 16,35 16,83 14,19 14,26 Moses (Koehn) 17,30 17,94 15,54 15,78 Google Translate 19,73 19,97 16,22 16,22 a dalších 9 systémů průměrné zlepšení +0,38 +0,19 Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 40/42

41 Shrnutí Depfix = automatická post-editace výstupů frázového strojového překladu (AJ ČJ) Lingvistická analýza v Treexu (M-, A-, T-rovina) zvýšena robustnost nástrojů (data obsahují chyby) Pravidlové i statistické opravy shody, negace, podměty, časy, valence Zvýšení kvality strojového překladu do značné míry nezávislé na překladovém systému Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 41/42

42 Děkuji za pozornost Rudolf Rosa, ÚFAL MFF UK tato prezentace i samotná diplomová práce budou k dipozici na webu Depfix je součástí Treexu trunk/treex/devel/depfix/ free software; můžete jej redistribuovat a/nebo modifikovat za stejných podmínek jako Perl Rudolf Rosa: Automatická post-editace výstupů frázového strojového překladu 42/42

Automatická post-editace výstupů frázového strojového překladu (Depfix)

Automatická post-editace výstupů frázového strojového překladu (Depfix) Rudolf Rosa diplomová práce Automatická post-editace výstupů frázového strojového překladu (Depfix) Automatic post-editing of phrase-based machine translation outputs Motivační příklad Zdroj (WMT 2010):

Více

Depfix: Jak dělat strojový překlad lépe než Google Translate

Depfix: Jak dělat strojový překlad lépe než Google Translate Rudolf Rosa rur@nikdeeu http://ufalmffcunicz/rudolf-rosa Depfix: Jak dělat strojový překlad lépe než Google Translate Univerzita Karlova v Praze Matematicko-fyzikální fakulta Ústav formální a aplikované

Více

Jak dělat strojový překlad lépe než Google Translate

Jak dělat strojový překlad lépe než Google Translate Mgr. Rudolf Rosa Jak dělat strojový překlad lépe než Google Translate Univerzita Karlova v Praze Matematicko-fyzikální fakulta Ústav formální a aplikované lingvistiky ProSŠ, Gymnázium Kladno, 23. října

Více

ve strojovém překladu

ve strojovém překladu Jaká data se používají ve strojovém překladu Ondřej Bojar bojar@ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky MFF UK ELRC Training Workshop, 15. prosinec 2015 1/39 Osnova Typy dat ve strojovém

Více

Faktorované překladové modely. Základní informace

Faktorované překladové modely. Základní informace Základní informace statistická metoda překladu statistická metoda překladu založena na frázích (nikoliv slovo slovo) statistická metoda překladu založena na frázích (nikoliv slovo slovo) doplňková informace

Více

Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus

Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus David Mareček obhajoba diplomové práce 8. 9. 2008 Motivace Na t-rovině jsou si jazyky podobnější alignment by zde měl být

Více

Popis morfologických značek poziční systém

Popis morfologických značek poziční systém Popis morfologických značek poziční systém Jan Hajič Ústav formální a aplikované lingvistiky MFF UK Morfologická analýza a syntéza Morfologické značky jsou součástí výsledku (výstupem) morfologické analýzy,

Více

Možnosti zlepšení strojového překladu z angličtiny do češtiny

Možnosti zlepšení strojového překladu z angličtiny do češtiny Prezentace k obhajobě diplomové práce Možnosti zlepšení strojového překladu z angličtiny do češtiny Martin Popel 14. září 2009 TectoMT Anotace překladových chyb Jednotlivá vylepšení Analýza Transfer Syntéza

Více

Japonsko-český strojový překlad

Japonsko-český strojový překlad V. Kůrková et al. (Eds.): ITAT 2014 with selected papers from Znalosti 2014, CEUR Workshop Proceedings Vol. 1214, pp. 85 92 http://ceur-ws.org/vol-1214, Series ISSN 1613-0073, c 2014 D. Variš, O. Bojar

Více

0. Úvod. 1. Syntaktické značkování textu

0. Úvod. 1. Syntaktické značkování textu Systém pro syntaktické značkování velkých textových korpusů 1 Tomáš Jelínek Ústav teoretické a komputační lingvistiky Filozofické fakulty Karlovy univerzity Abstract Syntactic annotation of corpora is

Více

Rudolf Rosa. Strojový překlad pojmenovaných entit za pomoci Wikipedie

Rudolf Rosa. Strojový překlad pojmenovaných entit za pomoci Wikipedie Rudolf Rosa Strojový překlad pojmenovaných entit za pomoci Wikipedie Obsah Strojový překlad Statistický strojový překlad Frázový statistický strojový překlad Překlad pojmenovaných entit O. Hálek, R. Rosa,

Více

Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech

Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech Kateřina Veselovská ÚFAL MFF UK veselovska@ufal.mff.cuni.cz

Více

Počítačová lingvistika v praxi Pavel Ševeček, Tomáš Pavelek

Počítačová lingvistika v praxi Pavel Ševeček, Tomáš Pavelek Počítačová lingvistika v praxi Pavel Ševeček, Tomáš Pavelek I. Zpracování textu II. III. IV. Jazyk G Desambiguace Kontrola gramatiky V. Kontrola stylu VI. Valence sloves VII. Vývoj a odezva I. Zpracování

Více

Automatické párování uzlů českých a anglických tektogramatických stromů

Automatické párování uzlů českých a anglických tektogramatických stromů Automatické párování uzlů českých a anglických tektogramatických stromů David Mareček pondělní seminář 13. 10. 2008 Osnova rozdíly mezi párováním na morfologické a na tektogramatické rovině ruční párování

Více

Ondřej Bojar Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze

Ondřej Bojar Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze ÔÐ ØÖÓ ÓÚ Ó Ô Ð Ù Ondřej Bojar bojar@ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze 18. říjen 2010 Aplikace strojového překladu Ç ÔÖ Þ

Více

Řešitelský kolektiv Finanční požadavky Finanční výhled na další roky Rozšiřující informace Přílohy. Role Celé jméno Typ odměny

Řešitelský kolektiv Finanční požadavky Finanční výhled na další roky Rozšiřující informace Přílohy. Role Celé jméno Typ odměny Detail projektu Řešitelský kolektiv Finanční požadavky Finanční výhled na další roky Rozšiřující informace Přílohy Základní informace o projektu č. 1572314 Český název projektu: Modelování závislostní

Více

Program pro automatickou opravu stochastické syntaktické anotace (analytická rovina PDT)

Program pro automatickou opravu stochastické syntaktické anotace (analytická rovina PDT) Program pro automatickou opravu stochastické syntaktické anotace (analytická rovina PDT) 1. Základní charakteristiky opravného programu Opravný program je počítačový software umožňující vyhledání a opravy

Více

IA161 Pokročilé techniky zpracování přirozeného jazyka

IA161 Pokročilé techniky zpracování přirozeného jazyka IA161 Pokročilé techniky zpracování přirozeného jazyka Strojový překlad Vít Baisa Překlad angličtina čeština Moses is an implementation of the statistical (or data-driven) approach to machine translation

Více

FAKULTA INFORMAČNÍCH TECHNOLOGIÍ

FAKULTA INFORMAČNÍCH TECHNOLOGIÍ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV POČÍTAČOVÉ GRAFIKY A MULTIMÉDIÍ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF COMPUTER GRAPHICS AND

Více

johanka April 16, 2008

johanka April 16, 2008 (Jak disambiguátoři přicházejí o iluze) April 16, 2008 Výchozí podmínky Co máme k dispozici? Jazyk LanGR + poloboha Pavla Květoně Pravidla pro (částečnou) morfologickou disambiguaci (Niki Petkevič, Tomáš

Více

Větná polarita v češtině. Kateřina Veselovská Žďárek Hořovice,

Větná polarita v češtině. Kateřina Veselovská Žďárek Hořovice, Větná polarita v češtině Kateřina Veselovská Žďárek Hořovice, 27. 11. 2009 1 Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání

Více

Moses. M. Fabianová, A. Štromajerová, M. Vaněk

Moses. M. Fabianová, A. Štromajerová, M. Vaněk Moses M. Fabianová, A. Štromajerová, M. Vaněk Osnova 1. Trocha historie 2. Co je to Moses? 3. V čem je Moses jiný/lepší než ostatní SMT překladače? 4. Využití, příklady, srovnání Trocha historie 50. léta

Více

1 Úvod 5 1.1 Co je PDT 2.0... 5 1.2 Historické pozadí projektu... 6 1.3 Vývoj projektu... 6. 2 Roviny anotace 11 2.1 Morfologická rovina...

1 Úvod 5 1.1 Co je PDT 2.0... 5 1.2 Historické pozadí projektu... 6 1.3 Vývoj projektu... 6. 2 Roviny anotace 11 2.1 Morfologická rovina... Průvodce PDT 2.0 Jan Hajič, Eva Hajičová, Jaroslava Hlaváčová, Václav Klimeš, Jiří Mírovský, Petr Pajas, Jan Štěpánek, Barbora Vidová Hladká, and Zdeněk Žabokrtský 20. června 2006 Obsah 1 Úvod 5 1.1 Co

Více

Morfologie odborných textů

Morfologie odborných textů Morfologie odborných textů Yvona Řepová Název školy Název a číslo projektu Název modulu Obchodní akademie a Střední odborné učiliště, Veselí nad Moravou Motivace žáků ke studiu technických předmětů OP

Více

Slovníky a morfologická analýza

Slovníky a morfologická analýza Počítačové zpracování přirozeného jazyka Slovníky a morfologická analýza Daniel Zeman http://ufal.mff.cuni.cz/course/popj1/ Slovník Zásobárna informací o slovech Morfologie vzory ohýbání, pravidelné odvozování

Více

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE. Ondřej Bojar Automatická extrakce. z korpusu Praha 2002

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE. Ondřej Bojar Automatická extrakce. z korpusu Praha 2002 Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Ondřej Bojar Automatická extrakce lexikálně-syntaktických údajů z korpusu Praha 2002 Ústav formální a aplikované lingvistiky Vedoucí

Více

Nainstalovat Tred!

Nainstalovat Tred! Nainstalovat Tred! http://ufal.mff.cuni.cz/tred/ 1 Korpusy a lingvistické nástroje Daniel Zeman zeman@ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova

Více

Co nového ve zpracování MWE Automatická identifikace

Co nového ve zpracování MWE Automatická identifikace Co nového ve zpracování MWE Automatická identifikace Společný workshop tří GAČRů 15. dubna 2013 Víceslovné výrazy Osnova Víceslovné výrazy (VV, MWE) v PDT 2.5 Automatická identifikace Problémy (Úpravy

Více

Japonsko-český strojový překlad

Japonsko-český strojový překlad Univerzita Karlova v Praze Matematicko-fyzikální fakulta BAKALÁŘSKÁ PRÁCE Dušan Variš Japonsko-český strojový překlad Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: RNDr. Ondřej Bojar,

Více

Přirozený jazyk a matematika: jak popsat češtinu tak, aby jí porozuměly počítače?

Přirozený jazyk a matematika: jak popsat češtinu tak, aby jí porozuměly počítače? Přirozený jazyk a matematika: jak popsat češtinu tak, aby jí porozuměly počítače? Markéta Lopatková Ústav formální a aplikované lingvistiky, MFF UK lopatkova@ufal.mff.cuni.cz Cíl popsat přirozený jazyk

Více

V této kapitole jsou popsány hlavní vlastnosti anotačního schématu spolu s důvody, proč byly zavedeny.

V této kapitole jsou popsány hlavní vlastnosti anotačního schématu spolu s důvody, proč byly zavedeny. Syntakticky anotovaný korpus českých textů Milena Hnátková, Petr Jäger, Tomáš Jelínek, Vladimír Petkevič, Alexandr Rosen, Hana Skoumalová Ústav teoretické a komputační lingvistiky, Filozofická fakulta

Více

ANOTACE K VÝUKOVÉ SADĚ č. VY_32_INOVACE_02_05_NEJ_Ps

ANOTACE K VÝUKOVÉ SADĚ č. VY_32_INOVACE_02_05_NEJ_Ps ANOTACE K VÝUKOVÉ SADĚ č. VY_32_INOVACE_02_05_NEJ_Ps Číslo projektu Číslo a název šablony klíčové aktivity Tematická oblast (předmět) Autor CZ.1.07/1.5.00/34.0705 III/2 Inovace a zkvalitnění výuky prostřednictvím

Více

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Adam Liška. Ústav formální a aplikované lingvistiky

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Adam Liška. Ústav formální a aplikované lingvistiky Univerzita Karlova v Praze Matematicko-fyzikální fakulta BAKALÁŘSKÁ PRÁCE Adam Liška Čištění paralelních dat pro strojový překlad Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: RNDr.

Více

Oddíl E učební osnovy VI.1.B LATINA

Oddíl E učební osnovy VI.1.B LATINA Podještědské gymnázium, s.r.o., Liberec, Sokolovská 328 Oddíl E učební osnovy VI.1.B LATINA Charakteristika předmětu: LATINA ve vyšším stupni osmiletého studia Obsah předmětu Latinský jazyk plní jednak

Více

LATINA. V rámci gymnaziálního vzdělání přispívá předmět Latina k utváření a rozvíjení klíčových kompetencí t těmito metodami:

LATINA. V rámci gymnaziálního vzdělání přispívá předmět Latina k utváření a rozvíjení klíčových kompetencí t těmito metodami: LATINA Název předmětu: Latina Charakteristika vyučovacího předmětu: Vyučovací předmět Latina vychází vychází z RVP G jako Doplňující vzdělávací obor. Lze ho studovat jako povinně volitelný předmět ve 2.

Více

VALENČNÍ SLOVNÍK ČESKÝCH SUBSTANTIV: VÝCHODISKA A CÍLE

VALENČNÍ SLOVNÍK ČESKÝCH SUBSTANTIV: VÝCHODISKA A CÍLE VALENČNÍ SLOVNÍK ČESKÝCH SUBSTANTIV: VÝCHODISKA A CÍLE Veronika Kolářová, Jana Klímová, Anna Vernerová Ústav formální a aplikované lingvistiky MFF UK Praha 22. 4. 2016 Slovanská lexikografie počátkem 21.

Více

Jazyky a jazykové technologie v České republice. Tomáš Svoboda Jan Hajič

Jazyky a jazykové technologie v České republice. Tomáš Svoboda Jan Hajič Jazyky a jazykové technologie v České republice Tomáš Svoboda Jan Hajič 1 Kolik jazyků máme v ČR? Jeden úřední jazyk (čeština) Skutečnost je složitější Turistika Obchod a mezinárodní komerční aktivity

Více

Jak lze v korpusech hledat doklady pro výzkum morfologie?

Jak lze v korpusech hledat doklady pro výzkum morfologie? Seminář cjbb75 1. 4. 2015 Jak lze v korpusech hledat doklady pro výzkum morfologie? Vyhledávání podle morfologické značky problém spolehlivosti desambiguace Vyhledejte v korpusu SYN2010 všechny vokativy

Více

SSOS_CJL_5.13. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Číslo a název projektu Číslo a název šablony

SSOS_CJL_5.13. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Číslo a název projektu Číslo a název šablony Číslo a název projektu Číslo a název šablony DUM číslo a název CZ.1.07/1.5.00/34.0378 Zefektivnění výuky prostřednictvím ICT technologií III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT SSOS_CJL_5.13

Více

KOMBINOVANÉ STATISTICKO-PRAVIDLOVÉ METODY ZNAČKOVÁNÍ ČEŠTINY. Drahomíra johanka Spoustová

KOMBINOVANÉ STATISTICKO-PRAVIDLOVÉ METODY ZNAČKOVÁNÍ ČEŠTINY. Drahomíra johanka Spoustová KOMBINOVANÉ STATISTICKO-PRAVIDLOVÉ METODY ZNAČKOVÁNÍ ČEŠTINY Drahomíra johanka Spoustová Copyright Institute of Formal and Applied Linguistics, 2009 ISBN 978-80-904175-4-0 Obsah 1 Úvod 1 2 Výchozí situace

Více

Korpusová lingvistika a počítačové zpracování přirozeného jazyka

Korpusová lingvistika a počítačové zpracování přirozeného jazyka Korpusová lingvistika a počítačové zpracování přirozeného jazyka Vladimír Petkevič & Alexandr Rosen Ústav teoretické a komputační lingvistiky Filozofické fakulty Univerzity Karlovy v Praze Korpusový seminář

Více

úč úč ž ů ž Č Č č č ů ž úč č úč ť Ň č ú Ý č č Ú Ú ť ú č ď ů ž š úč ž úč úč ž ť ď ť ď ž ú č č úč š ž Ů č č ú úč ž ů ť úč ž ž ž Ů č ž ú č Š úč č Úč Č Č š ď š Š š Ó Ó ž ůč ú Ď ť ž ů ů č ů Č ů ž úč Ý č ž úč

Více

č ů š ň č č Ú č č č Ú ů Ú č ž ú š š ý č ú ó ó ž č ý ý ý č ž č ý ž ý č ý ž ž č ý ý ý ž ý ý ý ý š ý š ů ů č č ý ž č ý ů š ž ý Ú Ú úč š ů ž ů ů Úč ž č ý č š ý ů č š ý ý ý ů č č ž ů š ů ů š ý ý ů ů č č ž ú

Více

Á Ě Í Ě Á Á ó č ž č ž č Í š úč é úč š ž č é ů č é č é é ů č ů č č ů é Ž š ů ů š č é Ž č é Ž č Í ž Ž Ž é é Ů é Ř ů ť š é é č é é é š č č é č č č č š č š é č é č ů č č š ú é č é š é Ž Ž é é ú č č é ů č š

Více

Nové EU projekty (od 2010)

Nové EU projekty (od 2010) Nové EU projekty (od 2010) Faust (STREP) T4ME Net (NoE) Jan Hajič & al. FAUST: Feedback Analysis for User-adaptive Statistical Translation 7. RP, kooperativní, STREP, 2010-13 (únor), GA #247762 Unit E1:

Více

Rekonstrukce standardizovaného textu z mluvené řeči

Rekonstrukce standardizovaného textu z mluvené řeči Rekonstrukce standardizovaného textu z mluvené řeči Marie Mikulová, Zdeňka Urešová Příspěvek shrnuje dosavadní poznatky získané při budování Pražského závislostního korpusu mluvené češtiny (Prague Dependency

Více

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ Číslo projektu Číslo a název šablony klíčové aktivity Tématická oblast CZ.1.07/1.5.00/34.0963 II/2 Inovace a zkvalitnění výuky směřující k rozvoji čtenářské a informační

Více

Pražský závislostní korpus jako elektronická cvičebnice češtiny

Pražský závislostní korpus jako elektronická cvičebnice češtiny Pražský závislostní korpus jako elektronická cvičebnice češtiny OndřejKučera ondrej.kucera@centrum.cz Abstrakt Pražský závislostní korpus patří mezi nejvýznamnější jazykové korpusy na světě. Cílem naší

Více

Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti

Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti Prima jednoduše mluví o sobě Slovní zásoba: elementární slovní 1 B/ 26, 27, 29, 30 tvoří jednoduché otázky a aktivně je používá zásoba pro zvolené tematické okruhy odpovídá na jednoduché otázky obsahující

Více

ZPRÁVA O PRŮBĚHU PRACÍ na programovém projektu Informační společnost 2005 1ET101120413

ZPRÁVA O PRŮBĚHU PRACÍ na programovém projektu Informační společnost 2005 1ET101120413 Národní 3, 117 20 Praha 1 List PT1 ZPRÁVA O PRŮBĚHU PRACÍ na programovém projektu Informační společnost Rok Identifikační kód projektu 2005 1ET101120413 01 Řešitel projektu Jméno: Mgr. Barbora Vidová Hladká,

Více

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ Číslo projektu Číslo a název šablony klíčové aktivity Tématická oblast CZ.1.07/1.5.00/34.0963 II/2 Inovace a zkvalitnění výuky směřující k rozvoji čtenářské a informační

Více

Vyjádření propozice pomocí verbálních substantiv v korpusech psané a mluvené češtiny

Vyjádření propozice pomocí verbálních substantiv v korpusech psané a mluvené češtiny Vyjádření propozice pomocí verbálních substantiv v korpusech psané a mluvené češtiny Veronika Kolářová, Jan Kolář, Marie Mikulová Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita

Více

OJ305 TYPOLOGIE JAZYKŮ z pohledu syntaxe

OJ305 TYPOLOGIE JAZYKŮ z pohledu syntaxe OJ305 TYPOLOGIE JAZYKŮ z pohledu syntaxe Syntaktická typologie co je to slovosled? co je to syntax? slovosled = pořadí větných členů ve větě syntax = slovosled, tedy pořadí větných členů, vztahy mezi nimi

Více

Počítačové zpracování češtiny. Syntaktická analýza. Daniel Zeman

Počítačové zpracování češtiny. Syntaktická analýza. Daniel Zeman Počítačové zpracování češtiny Syntaktická analýza Daniel Zeman http://ufal.mff.cuni.cz/course/popj1/ Syntaktická rovina Vztahy mezi větnými členy. Větný člen je pro nás slovo (tj. též interpunkce). Z praktických

Více

AX Systém pro automatizovanou extrakci lexikálně-syntaktických údajů z korpusu.

AX Systém pro automatizovanou extrakci lexikálně-syntaktických údajů z korpusu. AX Systém pro automatizovanou extrakci lexikálně-syntaktických údajů z korpusu. Ondřej Bojar obo@cuni.cz Abstrakt Systém AX je určen ke zpracování morfologicky analyzovaných vět přirozeného jazyka s cílem

Více

OBSAH. Předmluva (Libuše Dušková) DÍL I. Rozbor fonologický

OBSAH. Předmluva (Libuše Dušková) DÍL I. Rozbor fonologický OBSAH Předmluva (Libuše Dušková) DÍL I. Rozbor fonologický Úvod Rozdělení jazykového rozboru Poměr fonologie k fonetice. Dějiny bádání Fonémy a varianty Monofonémové hodnocení hláskových komplexů Dvoufonémové

Více

ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE

ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE Mgr. Barbora Štindlová, Ph. D., Mgr. Veronika Čurdová, Mgr. Petra Klimešová, Mgr. Eva Levorová ÚJOP UK, Praha Práce s chybou, Poděbrady

Více

Anotace na analytické rovině

Anotace na analytické rovině Anotace na analytické rovině Návod pro anotátory Jan Hajič, Jarmila Panevová, Eva Buráňová, Zdeňka Urešová, Alla Bémová Jiří Kárník, Jan Štěpánek, Petr Pajas 11. 10. 1999 ÚFAL MFF UK Praha Editoři: Eva

Více

Chytal tlouště na višni

Chytal tlouště na višni Chytal tlouště na višni Barbora Hladká Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze http://ufal.mff.cuni.cz Jedna noc s informatikou a matematikou MFF

Více

Učíme počítače (nejen) česky: ÚFAL

Učíme počítače (nejen) česky: ÚFAL Učíme počítače (nejen) česky: ÚFAL Barbora Hladká Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze http://ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky

Více

15. Věta jednoduchá Vypracovala: Martina Miškeříková, červenec 2013

15. Věta jednoduchá Vypracovala: Martina Miškeříková, červenec 2013 15. Věta jednoduchá Vypracovala: Martina Miškeříková, červenec 2013 Název školy Obchodní akademie a Střední odborné učiliště Veselí nad Moravou Název a číslo OP OP Vzdělávání pro konkurenceschopnost, CZ

Více

na postupech, které se souhrnně nazývají závislostními. Oba principy lze vykládat

na postupech, které se souhrnně nazývají závislostními. Oba principy lze vykládat Závislostní redukční analýza přirozených jazyků Markéta Lopatková, 1 Martin Plátek 2 a Vladislav Kuboň 3 1 CKL MFF UK, Praha lopatkova@ckl.mff.cuni.cz 2 KTIML MFF UK, Praha platek@ksi.ms.mff.cuni.cz 3

Více

Roční úvodní kurs českého jazyka pro nově příchozí žáky - cizince

Roční úvodní kurs českého jazyka pro nově příchozí žáky - cizince Roční úvodní kurs českého jazyka pro nově příchozí žáky - cizince Cíl kursu: 1/rychlé osvojení češtiny na komunikační úrovni - rozvoj slovní zásoby 2/ pochopení základních pravidel systému jazyka druhy

Více

Automatická detekce emocí v textu

Automatická detekce emocí v textu Automatická detekce emocí v textu Kateřina Veselovská veselovska@ufal.mff.cuni.cz New Media Inspiration, Praha 21. 2. 2015 Informace v textu objektivní fakta subjektivní názory pocity domněnky pozitivní

Více

NÁZEV TŘÍDA ANOTACE PLNĚNÉ VÝSTUPY KLÍČOVÁ SLOVA

NÁZEV TŘÍDA ANOTACE PLNĚNÉ VÝSTUPY KLÍČOVÁ SLOVA ČÍSLO SADY III/2 AUTOR/KA Radka Zborníková ČJL - Tvarosloví Slovní druhy číselné označení DUM NÁZEV TŘÍDA ANOTACE PLNĚNÉ VÝSTUPY KLÍČOVÁ SLOVA FORMÁT (pdf,, ) 1. Slovní druhy - přehled, opakování učiva

Více

Cl. Práce publikované v odborných Časopisech vydávaných v zahraničí

Cl. Práce publikované v odborných Časopisech vydávaných v zahraničí Příloha 6 Strukturovaná bibliografie Zdeněk Žabokrtský, 1999-2009 A. Monografie [1] Markéta Lopatková, Zdeněk Žabokrtský, and Václava Kettnerová. Valenční slovník českých sloves. Nakladatelství Karolinum,

Více

Valence českých deverbativních substantiv reprezentujících vybrané sémantické třídy

Valence českých deverbativních substantiv reprezentujících vybrané sémantické třídy Valence českých deverbativních substantiv reprezentujících vybrané sémantické třídy Veronika Kolářová Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze 1

Více

PDT-Vallex: trochu jiný valenční slovník

PDT-Vallex: trochu jiný valenční slovník PDT-Vallex: trochu jiný valenční slovník Zdeňka Urešová uresova@ufal.mff.cuni.cz Univerzita Karlova v Praze Ústav formální a aplikované lingvistiky Malostranské nám. 25 11800 Praha 1 Česká republika Abstract

Více

Aktivní detekce chyb

Aktivní detekce chyb Fakulta aplikovaných věd, Katedra kybernetiky a Výzkumné centrum Data - Algoritmy - Rozhodování Západočeská univerzita v Plzni Prezentace v rámci odborného semináře Katedry kybernetiky Obsah Motivační

Více

Strojové učení a pravidla pro extrakci informací z textů

Strojové učení a pravidla pro extrakci informací z textů Strojové učení a pravidla pro extrakci informací z textů Barbora Hladká Ústav formální a aplikované lingvistiky MFF UK http://ufal.mff.cuni.cz Machine Learning Meetups, 2. prosince 2015 Pozvánka Jako výzkumníci

Více

Automatická detekce emocí v textu

Automatická detekce emocí v textu Automatická detekce emocí v textu Kateřina Veselovská veselovska@ufal.mff.cuni.cz New Media Inspiration, Praha 21. 2. 2015 Informace v textu objektivní fakta subjektivní názory pocity domněnky pozitivní

Více

SLOVNÍ DRUHY Platón Aristoteles Dionysios Thrácký Priscianus

SLOVNÍ DRUHY Platón Aristoteles Dionysios Thrácký Priscianus SLOVNÍ DRUHY Historicky podmíněná kategorizace lexikálních jednotek/slov. Védángy (disciplíny umožňující studium véd Nirukta 5./6. stol. př. n. l. základy popisu jazyka glosář etymologie, forma a význam

Více

Čím může bohemistice přispět současná počítačová lingvistika?

Čím může bohemistice přispět současná počítačová lingvistika? Jarmila Panevová (Univerzita Karlova, Praha) Čím může bohemistice přispět současná počítačová lingvistika? I. Po několik destiletí (od 2. poloviny 20. století) se mohlo zdát, že počítačová a formální lingvistika

Více

ČASOPIS PRO MODERNÍ FILOLOGII 99, 2017, Č. 1, S

ČASOPIS PRO MODERNÍ FILOLOGII 99, 2017, Č. 1, S ČASOPIS PRO MODERNÍ FILOLOGII 99, 2017, Č. 1, S. 131 146 MARKÉTA LOPATKOVÁ A KOL.: VALENČNÍ SLOVNÍK ČESKÝCH SLOVES VALLEX Druhé vydání, přepracované a rozšířené Praha: Karolinum, 2016, 698 stran ISBN 978-80-246-3542-2

Více

4.9.1. Základy latiny II

4.9.1. Základy latiny II 4.9.1. Základy latiny II Základy latiny jsou dvouletý volitelný předmět, jehož hlavním cílem je poskytnout žákům základní orientaci v systému latinské gramatiky v rozsahu středoškolského učiva a připravit

Více

pokroky ve johanka Obsah telenovely Bez ladu a skladu Unsupervised johanka 21. dubna 2008

pokroky ve johanka Obsah telenovely Bez ladu a skladu Unsupervised johanka 21. dubna 2008 (nejen) češtiny 21. dubna 2008 Tipovací soutěž Pro který/é z následujících jazyků bude v průběhu přednášky překonán state-of-the-art? Čeština 95.68 % ( et. al., 2007) Slovenština 89.36 % (TnT, Brants 2000)

Více

L A TEX Korektura textu

L A TEX Korektura textu Semestrální práce z předmětu Kartografická polygrafie a reprografie L A TEX Korektura textu Autor: Jana Baarová,Pavla Ptáčková, Hana Gubániová, Rudolf Klímek Editor: Jan Varyš Praha, 5.5. 2010 Katedra

Více

Antiplagiátorské nástroje pro naše repozitáře

Antiplagiátorské nástroje pro naše repozitáře Antiplagiátorské nástroje pro naše repozitáře Jan Mach Vysoká škola ekonomická v Praze Univerzita Karlova v Praze 23. 10. 2013 Seminář ke zpřístupňování šedé literatury Co je plagiát? 1. klonování vydávání

Více

Počítač, dataprojektor, interaktivní tabule, smartphone, plány měst, mapy, slovníky

Počítač, dataprojektor, interaktivní tabule, smartphone, plány měst, mapy, slovníky Předmět: Náplň: Třída: Počet hodin: Pomůcky: Německý jazyk Výstupy odpovídající úrovni A1 podle SERR 1. ročník 4 hodiny týdně Počítač, dataprojektor, interaktivní tabule, smartphone, plány měst, mapy,

Více

OBSAH SEZNAM TERMÍNŮ, ZKRTATEK A ZNAČEK POUŽÍVANÝCH V UČEBNICI POSTAVY PŘÍBĚHU 3 LEKCE 1 STUDIUM JAZYKŮ 8 LEKCE 2 LIDSKÁ KOMUNIKACE 42.

OBSAH SEZNAM TERMÍNŮ, ZKRTATEK A ZNAČEK POUŽÍVANÝCH V UČEBNICI POSTAVY PŘÍBĚHU 3 LEKCE 1 STUDIUM JAZYKŮ 8 LEKCE 2 LIDSKÁ KOMUNIKACE 42. SEZNAM TERMÍNŮ, ZKRTATEK A ZNAČEK POUŽÍVANÝCH V UČEBNICI VIII POSTAVY PŘÍBĚHU 3 LEKCE 1 STUDIUM JAZYKŮ 8 MINIDIALOGY 9 SLOVNÍ ZÁSOBA 11 DIALOGY 15 GRAMATIKA 18 A. Přítomný čas 18 Cvičení A 20 B. Budoucí

Více

Úvod do gramatiky. Galénos a Hippokratés na fresce v kryptě katedrály v Anagni, vybudované v roce 1255

Úvod do gramatiky. Galénos a Hippokratés na fresce v kryptě katedrály v Anagni, vybudované v roce 1255 Úvod do gramatiky Galénos a Hippokratés na fresce v kryptě katedrály v Anagni, vybudované v roce 1255 Slovní druhy Z deseti slovních druhů se v lékařské terminologii uplatňují jen některé: a) podstatná

Více

LATINA. Oddíl E učební osnovy VI.1.B

LATINA. Oddíl E učební osnovy VI.1.B LATINA Oddíl E učební osnovy VI.1.B Charakteristika předmětu: LATINA ve vyšším stupni osmiletého studia Obsah předmětu Latinský jazyk plní jednak funkci propedeutickou, tj. poskytuje elementární úvod do

Více

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT ANALÝZA A KLASIFIKACE DAT RNDr. Eva Janoušová INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ HODNOCENÍ ÚSPĚŠNOSTI KLASIFIKACE A SROVNÁNÍ KLASIFIKÁTORŮ ÚVOD Vstupní data Subjekt Objem hipokampu Objem komor Skutečnost

Více

Automatická anotace angličtiny na tektogramatické

Automatická anotace angličtiny na tektogramatické Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Josef Toman Automatická anotace angličtiny na tektogramatické rovině Ústav formální a aplikované lingvistiky Vedoucí diplomové práce:

Více

Příruční mluvnice češtiny. 2. vyd., Praha: Lidové noviny, 1996. 799 s. ISBN 80-7106-134-4.

Příruční mluvnice češtiny. 2. vyd., Praha: Lidové noviny, 1996. 799 s. ISBN 80-7106-134-4. Morfologie Seznam studijní literatury: Příruční mluvnice češtiny. 2. vyd., Praha: Lidové noviny, 1996. 799 s. ISBN 80-7106-134-4. Hubáček, J., Jandová, E., Svobodová, J. Čeština pro učitele. 3. vyd., Opava:

Více

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA září Žák porovnává významy slov, zvláště slova podobného nebo stejného významu a slova vícevýznamová. Žák dokáže rozlišit mluvnické kategorie podstatných jmen (pád, číslo, rod), rozliší větu jednoduchou

Více

VY_12_INOVACE_32_ZAKLAD_VETY. Časová dotace: 45 min Datum ověření:

VY_12_INOVACE_32_ZAKLAD_VETY. Časová dotace: 45 min Datum ověření: Kód materiálu: Název materiálu: VY_12_INOVACE_32_ZAKLAD_VETY Základ věty Předmět: Český jazyk Ročník: 4. Časová dotace: 45 min Datum ověření: 17. 4. 2013 Jméno autora: Klíčová slova: Výchovné a vzdělávací

Více

Tematický plán Český jazyk pro 4. ročník

Tematický plán Český jazyk pro 4. ročník Tematický plán Český jazyk pro 4. ročník Vyučující: Klára Dolanová Hodinová dotace: 7 hodin týdně Školní rok: 2015/2016 ZÁŘÍ 1. a UČ str. 3 9 Opakování (Věta souvětí; Význam slov; Slova s citovým zabarvením,

Více

Morfologie, morfologická analýza

Morfologie, morfologická analýza Morfologie, morfologická analýza Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Obsah: Morfologie Úvod do počítačové lingvistiky 4/11 1 / 30 Morfologie Morfologie Morfologie nauka

Více

qwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjkl zxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiop asdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqw

qwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjkl zxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiop asdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqw qwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjkl zxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiop asdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqw Semestrální práce z předmětu Kartografická polygrafie a reprografie

Více

Zpracovala: Mgr.Anna Šrubařová, katedra čes. jazyka a literatury s did. PdF OU

Zpracovala: Mgr.Anna Šrubařová, katedra čes. jazyka a literatury s did. PdF OU Studijní opora k předmětu MATEŘSKÝ JAZYK 4 SYNTAX (KCD/ MJAZ4, XJAZ 4, CSKLD) Další využití: Seminář k mateřskému jazyku 4 (KCD/SMMJ4) Interpunkční seminář (KCD/INTCS) Zpracovala: Mgr.Anna Šrubařová, katedra

Více

Sémantický web a extrakce

Sémantický web a extrakce Sémantický web a extrakce informací Martin Kavalec kavalec@vse.cz Katedra informačního a znalostního inženýrství FIS VŠE Seminář KEG, 11. 11. 2004 p.1 Přehled témat Vize sémantického webu Extrakce informací

Více

Korpus pro automatické rozpoznání českých slov v anglickém mluveném projevu

Korpus pro automatické rozpoznání českých slov v anglickém mluveném projevu Korpus pro automatické rozpoznání českých slov v anglickém mluveném projevu Ondřej Cífka, Ondřej Bojar Ústav formální a aplikované lingvistiky, MFF UK Korpusová lingvistika Praha, 17. září 2016 1 / 18

Více

Univerzita Karlova v Praze. Filozofická fakulta. Diplomová práce. The Constituent Negation and Ways to Express it. in Contemporary Czech

Univerzita Karlova v Praze. Filozofická fakulta. Diplomová práce. The Constituent Negation and Ways to Express it. in Contemporary Czech Univerzita Karlova v Praze Filozofická fakulta Ústav českého jazyka a teorie komunikace Diplomová práce Kateřina Veselovská Členská negace a způsob jejího vyjadřování v současné češtině The Constituent

Více

Počítačové zpracování přirozeného jazyka. Daniel Zeman

Počítačové zpracování přirozeného jazyka. Daniel Zeman Počítačové zpracování přirozeného jazyka Daniel Zeman http://ufal.mff.cuni.cz/course/popj1/ zeman@ufal.mff.cuni.cz Předpoklady Žádné (téměř) Pouze: Základní znalost programování v některém programovacím

Více

MASARYKOVA UNIVERZITA Ekonomicko-správní fakulta

MASARYKOVA UNIVERZITA Ekonomicko-správní fakulta MASARYKOVA UNIVERZITA Ekonomicko-správní fakulta PŘIJÍMÁNÍ KE STUDIU NA AKADEMICKÝ ROK 2009/2010 V souladu s 49 zákona č. 111/1998 Sb. odstavec 5 zveřejňuji informaci o přijímacím řízení na akademický

Více

Jazyk a jazyková komunikace 2. ročník a sexta

Jazyk a jazyková komunikace 2. ročník a sexta Předmět: Náplň: Třída: Počet hodin: Pomůcky: Tvarosloví Český jazyk (CEJ) Jazyk a jazyková komunikace 2. ročník a sexta 2 hodiny týdně (viz poznámky) S jistotou určí slovní druh a pojmenuje jej cizím termínem

Více

ŠVP Gymnázium Ostrava-Zábřeh. 4.8.20. Latina

ŠVP Gymnázium Ostrava-Zábřeh. 4.8.20. Latina 4.8.20. Latina A) Obsahové, časové a organizační vymezení předmětu: Důležitost a význam studia latinského jazyka dokazuje nejen jeho několikasetletá tradice. I v dnešní době má tento doplňující vzdělávací

Více

K některým otázkám závislostní gramatiky *

K některým otázkám závislostní gramatiky * K některým otázkám závislostní gramatiky * EVA HAJIČOVÁ On some issues of dependency grammar ABSTRACT: The popularity of dependency-based syntax has grown in the last thirty years, in spite of the fact

Více