RNDr. Ondřej Bojar, Ph.D.



Podobné dokumenty
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech

Cl. Práce publikované v odborných Časopisech vydávaných v zahraničí

Výjezdy zaměstnanců VUT v Brně na výukové pobyty ERASMUS. Statistiky za akademický rok 2009/2010

Publications 1 Barbora Vidová Hladká March 2017

Barbora Vidová Hladká Publications as of March 2016

Faktorované překladové modely. Základní informace

Životopis Duben 2008

Mzdy na ÚFALu

Výjezdy zaměstnanců VUT v Brně na výukové pobyty ERASMUS. Statistiky za akademický rok 2010/2011

Strukturovaný životopis

Výjezdy zaměstnanců VUT v Brně na školení ERASMUS. Statistiky za akademický rok 2010/2011

Common Language Resources and Their Applications

Curriculum Vitae. Jméno disertace: Algebraic Properties of Fuzzy Logics Školitel: prof. Ing. Mirko Navara, DrSc.

Translation Model Interpolation for Domain Adaptation in TectoMT

Životopis. Osobní informace. Pracovní pozice

On the Structure of Constituent Negation in Czech

Výsledky dosažené v roce 2007

Automatická post-editace výstupů frázového strojového překladu (Depfix)

Korpusová lingvistika a počítačové zpracování přirozeného jazyka

Řešitelský kolektiv Finanční požadavky Finanční výhled na další roky Rozšiřující informace Přílohy. Role Celé jméno Typ odměny

Education and Training

Automatická post-editace výstupů frázového strojového překladu (Depfix)

pro aplikovanou a průmyslovou matematiku

Životopis. Osobní údaje. Vzdělání. Zaměstnání. Pedagogická činnost na VŠE v Praze. Vysoká škola ekonomická v Praze

PANM 16. List of participants. Terms of use:

PANM 17. List of participants. Terms of use:

Identifikace poruchy osobnosti z psaného textu

Compression of a Dictionary

PROJEKT SEN-NET (SENIORS IN NETWORK)

Životopis. Osobní údaje. Vzdělání. Zaměstnání. Řešené projekty. Projekty mimo univerzitu. Akademické stáže. doc. Ing. Romana Čižinská, Ph.D.

Rudolf Rosa. Strojový překlad pojmenovaných entit za pomoci Wikipedie

[26] Šeda, M.: Motion Planning in the Plane with Polygonal Obstacles. Engineering Mechanics, Vol. 12, No. 4, 2005, pp ISSN

Date Meeting Place and Host Higher Education Institution Rector-Host. Miroslav Holeček

Moses. M. Fabianová, A. Štromajerová, M. Vaněk

Hodnocení ISO pro rok 2017/18

Korpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105

RELATIONAL DATA ANALYSIS

VŠEOBECNÁ TÉMATA PRO SOU Mgr. Dita Hejlová

Ztracená 2553/3, Opava, , Czech Republic Born: Phone:

K otázce pokrytí publikační aktivity českých vysokých škol v bibliografických bázích dat

PŘILOHY Příloha 1. Vzor dotazníku

Co je kognitivní informatika?

Časopis Sociální pedagogika Social Education

Strukturovaný životopis

Koncepce rozvoje Ústavu teoretické a komputační lingvistiky FF UK na období Úvod

VIII. ÚPLNÉ ZNĚNÍ Přílohy č. 2 STATUTU UNIVERZITY KARLOVY V PRAZE ORGANIZAČNÍ ŘÁD ZE DNE 20. ČERVNA 2014

Jaký programovací jazyk učit jako první a jak ho učit?

Svět kolem nás Kalendář z fotografií zaměstnanců DEL a.s. DEL a.s., Strojírenská Žďár nad Sázavou CZECH REPUBLIC

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Britské společenství národů. Historie Spojeného království Velké Británie a Severního Irska ročník gymnázia (vyšší stupeň)

Evropské fórum vědy a techniky praha

IT4Innovations Centre of Excellence

- chování zvířat a člověka, vztah stresových hormonů a sociální hierarchie, osobnost u zvířat, evoluční antropologie

Algoritmy ořezávání. Habilitační práce. (Clipping Algorithms) (Habilitation Thesis) Prof.Ing.Václav Skala, CSc.

Martin Vrbka 0/14. Institute of Machine and Industrial Design Faculty of Mechanical Engineering Brno University of Technology

Jazyky a počítač: překážky a možnosti. Eva Hajičová MFF UK Praha

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů

International MYELOMA Foundation. International Myeloma Foundation

PANM 18. List of participants. Terms of use:

Projekt OpenAIRE výzva a příležitost i pro Českou republiku

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Adam Liška. Ústav formální a aplikované lingvistiky

B-IIa Studijní plány pro bakalářský SP Informatika se zaměřením na vzdělávání

Stanovisko habilitační komise

Zachycení (nejen) koordinací v závislostních stromech

Kartografické zdroje jako kulturní dědictví - výsledky stejnojmenného projektu

Klepnutím lze Introduction upravit styl předlohy. nadpisů.

Strukturovaný životopis

IA161 Pokročilé techniky zpracování přirozeného jazyka

LETNÍ ŠKOLA CVNS Současná témata ve výzkumu neziskového sektoru a občanské společnosti TELČ

Výroční zpráva České společnosti pro mechaniku za rok 2003

model arabské morfologie Otakar Smrž

ZPRÁVY České parazitologické společnosti

1. Publikační činnost přehled publikací v následující skladbě

KOMPENDIUM STATISTIK CESTOVNÍHO RUCHU V ČESKÉ REPUBLICE COMPENDIUM OF TOURISM STATISTICS IN THE CZECH REPUBLIC

Genetické programování 3. část

Bibliometric probes into the world of scientific publishing: Economics first


Ing. Robert Jurča, PhD. odborný asistent

Korpusová lingvistika a počítačová lexikografie. Od 60. let 20. st.

Zelený produkt automobilek a jeho vnímání různými generacemi českých spotřebitelů EVA JADERNÁ, MARTIN MLÁZOVSKÝ

Sémantický web 10 let poté

dokumentu: Proceedings of 27th International Conference Mathematical Methods in

PANM 14. List of participants. Terms of use:

Název školy STŘEDNÍ ODBORNÁ ŠKOLA a STŘEDNÍ ODBORNÉ UČILIŠTĚ, Česká Lípa, 28. října 2707, příspěvková organizace

Národní spolupráce. Workshop na POSED. Michal Sikora Barbora Chmelíková. Subject Name Name, Position

Publikační činnost. PhDr. Olga Pechová, Ph.D. Ke dni: 26. března Přehled publikační činnosti člena Katedry psychologie FF UP v Olomouci

Rok narození 1963 Rozsah pr. vzt. na VŠ 1 Do kdy

Politické vzdělávání a podpora demokracie od roku Political Education and Democracy Support since 1999

MEZINÁRODNÍ OCHRANA V ČESKÉ REPUBLICE měsíční statistický přehled. INTERNATIONAL PROTECTION IN THE CZECH REPUBLIC monthly statistical overview

Petr Hájek and Fuzzy Logic in this Country

Gymnázium, Brno, Slovanské nám. 7, SCHEME OF WORK Mathematics SCHEME OF WORK. cz

UNIVERZITA KARLOVA FAKULTA SOCIÁLNÍCH VĚD

Hodnocení ISO pro rok 2015 katedra 714

Závěrečná zpráva projektu Experimentální výpočetní grid pro numerickou lineární algebru

Jak dělat strojový překlad lépe než Google Translate

Přehled modelů reputace a důvěry na webu

Syntactic annotation of a second-language learner corpus

The state of literature courses in undergraduate and graduate English language teacher training programmes across Slovakia

Příloha č. 1 Návrh Projektu velké infrastruktury schválený vládou

Just write down your most recent and important education. Remember that sometimes less is more some people may be considered overqualified.

Transkript:

RNDr. Ondřej Bojar, Ph.D. Narozen: 7. března 1979 v Praze E-mail, web: bojar@ufal.mff.cuni.cz; http://www.cuni.cz/ obo Dosažené vzdělání: 2003-2008 doktorské studium MFF UK, obor Matematická lingvistika disertační práce: Využití lingvistických dat ve strojovém překladu 1997-2003 magisterské studium MFF UK, obor Informatika, prospěl s vyznamenáním diplomová práce: Automatická extrakce lexikálně-syntaktických údajů z korpusu 1997-1999 souběžné studium na Fakultě jaderné a fyzikálně inženýrské, ČVUT 1993-1997 gymnázium Zborovská, Praha 5, maturita s vyznamenáním Odborná praxe: od 2010 odborný asistent na MFF UK od 2004 výuka na MFF UK a FJFI ČVUT(cvičení, vedení studentských prací, vlastní seminář) 2010 dvouměsíční pobyt na RWTH Aachen University, katedra informatiky I6 2006-2007 roční studijní pobyt na univerzitě v Melbourne, katedra informatiky(csse) účast na výuce(cvičení ze zpracování textů přirozeného jazyka) léto 2006 účast na šestitýdenním workshopu na Johns Hopkins University, Baltimore podzim 2005 dvouměsíční studijní pobyt na RWTH Aachen University, katedra informatiky I6 2000-2005 vedlejší pracovní poměr, pozice analytik ve společnosti Internet Info, s.r.o., http://www.iinfo.cz/, publikace odborných studií o Internetu 2003-2004 půlroční studijní a pracovní pobyt na Sárské univerzitě, Saarbrücken 1995-2003 výuka pracovních činností- počítačů pro 8. a 9. roč. ZŠ 1996-1999 založení a správa stránek http://www.cestina.cz/ 1996-1997 spoluzakladatel a místopředseda Klubu přátel počítačů Macintosh 1994-1997 publikační činnost v časopise MacWorld(PC World) Účast v projektech: od 2012 EU FP7 CSA MosesCore(Podpora pro překladový systém Moses) 2011-2013 GAČR: Čeština ve věku strojového překladu 2010-2012 GAČR PGS: Hybridní frázový a hloubkově-syntaktický strojový překlad 2009-2012 EU FP7 EuroMatrixPlus(Strojový překlad evropských jazyků uživatelům) 2006-2009 EU FP6 EuroMatrix(Strojový překlad mezi jazyky Evropské unie) od 2004 PCEDT(Prague Czech-English Dependency Treebank) 2004-2005 VALLEX(Valenční slovník pro češtinu) 2003-2005 Strojový překlad ekonomických textů z češtiny do angličtiny 2000-2002 softwarový projekt Enti- Simulátor přirozeného prostředí lidského světa http://ufal.mff.cuni.cz/ bojar/enti Další dovednosti a zkušenosti: angličtina(plynně, Certificate in Advanced English), němčina(plynně, Zentrale Mittelstufenprüfung) řidičské oprávnění B programovací jazyky Mercury, Perl, Prolog, SQL(aktivně), C, C++, Java, PHP, C#,...(pasivně) bohaté programátorské zkušenosti v prostředí Unixu(a dříve Mac OS a DOS) bohaté programátorské zkušenosti v prostředí TCP/IP, Internetu 1

Vybrané publikace: Knihy Ondřej Bojar, Silvie Cinková, Jan Hajič, Barbora Hladká, Vladislav Kuboň, Jiří Mírovský, Jarmila Panevová, Nino Peterek, Johanka Spoustová, and Zdeněk Žabokrtský. 2012. The Czech Language in the Digital Age. Springer-Verlag Berlin Heidelberg, Berlin, Germany. Ondřej Bojar. 2012. Čeština a strojový překlad(czech Language and Machine Translation), volume 11 of Studies in Computational and Theoretical Linguistics. ÚFAL, Praha, Czech Republic. Ondřej Bojar. 2009. Exploiting Linguistic Data in Machine Translation, volume 3 of Studies in Computational and Theoretical Linguistics. ÚFAL, Prague, Czech Republic. Recenzované Jiří Maršík and Ondřej Bojar. 2012. TrTok: A Fast and Trainable Tokenizer for Natural Languages. Prague Bulletin of Mathematical Linguistics, 98:75 85, September. Ondřej Bojar and Dekai Wu. 2012. Towards a Predicate-Argument Evaluation for MT. In Proceedings of the Sixth Workshop on Syntax, Semantics and Structure in Statistical Translation, pages 30 38, Jeju, Republic of Korea, July. Association for Computational Linguistics. Ondřej Bojar, Zdeněk Žabokrtský, Ondřej Dušek, Petra Galuščáková, Martin Majliš, David Mareček, Jiří Maršík, Michal Novák, Martin Popel, and Aleš Tamchyna. 2012. The Joy of Parallelism with CzEng 1.0. In Proceedings of the Eighth International Language Resources and Evaluation Conference(LREC 12), pages 3921 3928, Istanbul, Turkey, May. ELRA, European Language Resources Association. Mark Fishel, Rico Sennrich, Maja Popović, and Ondřej Bojar. 2012. TerrorCat: a Translation Error Categorization-based MT Quality Metric. In Proceedings of the Seventh Workshop on Statistical Machine Translation, pages 64 70, Montréal, Canada, June. Association for Computational Linguistics. Mark Fishel, Ondřej Bojar, and Maja Popović. 2012. Terra: a Collection of Translation Error-Annotated Corpora. In Proceedings of the Eighth International Language Resources and Evaluation Conference(LREC 12), pages 7 14, Istanbul, Turkey, May. ELRA, European Language Resources Association. Aleš Tamchyna, Petra Galuščáková, Amir Kamran, Miloš Stanojević, and Ondřej Bojar. 2012. Selecting Data for English-to-Czech Machine Translation. In Proceedings of the Seventh Workshop on Statistical Machine Translation, pages 374 381, Montréal, Canada, June. Association for Computational Linguistics. Ondřej Bojar, Bushra Jawaid, and Amir Kamran. 2012. Probes in a Taxonomy of Factored Phrase-Based Models. In Proceedings of the Seventh Workshop on Statistical Machine Translation, pages 253 260, Montréal, Canada, June. Association for Computational Linguistics. Petra Galuščáková and Ondřej Bojar. 2012. Improving SMT by Using Parallel Data of a Closely Related Language. In Human Language Technologies The Baltic Perspective Proceedings of the Fifth International Conference Baltic HLT 2012, volume 247 of Frontiers in AI and Applications, pages 58 65, Amsterdam, Netherlands, October. IOS Press. Jan Berka, Ondřej Bojar, Mark Fishel, Maja Popović, and Daniel Zeman. 2012. Automatic MT Error Analysis: Hjerson Helping Addicter. In Proceedings of the Eighth International Language Resources and Evaluation Conference(LREC 12), pages 2158 2763, Istanbul, Turkey, May. ELRA, European Language Resources Association. Jan Hajič, Eva Hajičová, Jarmila Panevová, Petr Sgall, Ondřej Bojar, Silvie Cinková, Eva Fučíková, Marie Mikulová, Petr Pajas, Jan Popelka, Jiří Semecký, Jana Šindlerová, Jan Štěpánek, Josef Toman, Zdeňka Urešová, and Zdeněk Žabokrtský. 2012. Announcing Prague Czech-English Dependency Treebank 2.0. In Proceedings of the Eighth International Language Resources and Evaluation Conference(LREC 12), pages 3153 3160, Istanbul, Turkey, May. ELRA, European Language Resources Association. David Mareček, Rudolf Rosa, Petra Galuščáková, and Ondřej Bojar. 2011. Two-step translation with grammatical post-processing. In Proceedings of the Sixth Workshop on Statistical Machine Translation, pages 426 432, Edinburgh, Scotland, July. Association for Computational Linguistics. Jan Berka, Martin Černý, and Ondřej Bojar. 2011. Quiz-Based Evaluation of Machine Translation. Prague Bulletin of Mathematical Linguistics, 95:77 86, March. Ondřej Hálek, Rudolf Rosa, Aleš Tamchyna, and Ondřej Bojar. 2011. Named Entities from Wikipedia for Machine Translation. In Markéta Lopatková, editor, ITAT 2011 Information Technologies Applications and Theory, volume 788, pages 23 30, September. Ondřej Bojar and Aleš Tamchyna. 2011. Improving Translation Model by Monolingual Data. In Proceedings of the Sixth Workshop on Statistical Machine Translation, pages 330 336, Edinburgh, Scotland, July. Association for Computational Linguistics. Ondřej Bojar, Petra Galuščáková, and Miroslav Týnovský. 2011. Evaluating Quality of Machine Translation from Czech to Slovak. In Markéta Lopatková, editor, Information Technologies Applications and Theory, pages 3 9, September. 2

Česlav Przywara and Ondřej Bojar. 2011. eppex: Epochal Phrase Table Extraction for Statistical Machine Translation. Prague Bulletin of Mathematical Linguistics, 96:89 98, October. Mark Fishel, Ondřej Bojar, Daniel Zeman, and Jan Berka. 2011. Automatic Translation Error Analysis. In Text, Speech and Dialogue: 14th International Conference, TSD 2011, volume LNAI 3658. Springer Verlag, September. Matouš Macháček and Ondřej Bojar. 2011. Approximating a Deep-Syntactic Metric for MT Evaluation and Tuning. In Proceedings of the Sixth Workshop on Statistical Machine Translation, pages 92 98, Edinburgh, Scotland, July. Association for Computational Linguistics. Ondřej Bojar. 2011. Analyzing Error Types in English-Czech Machine Translation. Prague Bulletin of Mathematical Linguistics, 95:63 76, March. Daniel Zeman, Mark Fishel, Jan Berka, and Ondřej Bojar. 2011. Addicter: What Is Wrong with My Translations? Prague Bulletin of Mathematical Linguistics, 96:79 88, October. Ondřej Bojar, Miloš Ercegovčević, Martin Popel, and Omar Zaidan. 2011. A Grain of Salt for the WMT Manual Evaluation. In Proceedings of the Sixth Workshop on Statistical Machine Translation, pages 1 11, Edinburgh, Scotland, July. Association for Computational Linguistics. Ondřej Bojar, Kamil Kos, and David Mareček. 2010. Tackling Sparse Data Issue in Machine Translation Evaluation. In Proceedings of the ACL 2010 Conference Short Papers, pages 86 91, Uppsala, Sweden, July. Association for Computational Linguistics. Ondřej Bojar, Adam Liška, and Zdeněk Žabokrtský. 2010. Evaluating Utility of Data Sources in a Large Parallel Czech-English Corpus CzEng 0.9. In Proceedings of the Seventh International Language Resources and Evaluation (LREC 10), pages 447 452, Valletta, Malta, May. ELRA, European Language Resources Association. Ondřej Bojar, Pavel Straňák, and Daniel Zeman. 2010. Data Issues in English-to-Hindi Machine Translation. In Proceedings of the Seventh International Language Resources and Evaluation(LREC 10), pages 1771 1777, Valletta, Malta, May. ELRA, European Language Resources Association. Jana Šindlerová and Ondřej Bojar. 2010. Building a Bilingual ValLex Using Treebank Token Alignment: First Observations. In Proceedings of the Seventh International Language Resources and Evaluation(LREC 10), pages 304 309, Valletta, Malta, May. ELRA, European Language Resources Association. Aleš Tamchyna and Ondřej Bojar. 2010. Bohatá anotace ve frázovém strojovém překladu. In ITAT 2010 Informačné technológie Aplikácie a Teória, Zborník príspevkov prezentovaných na konferencii ITAT, pages 99 106, September. Jiří Diviš and Ondřej Bojar. 2010. Automatic Source Code Reduction. In ITAT 2010 Information Technologies Applications and Theory, pages 9 16. PONT s. r. o., Seňa, Slovakia, September. Ondřej Bojar and Kamil Kos. 2010. 2010 Failures in English-Czech Phrase-Based MT. In Proceedings of the Joint Fifth Workshop on Statistical Machine Translation and MetricsMATR, pages 60 66, Uppsala, Sweden, July. Association for Computational Linguistics. Hana Klempová, Michal Novák, Peter Fabian, Jan Ehrenberger, and Ondřej Bojar. 2009. Získávání paralelních textů z webu. In ITAT 2009 Information Technologies Applications and Theory, September. Jana Šindlerová and Ondřej Bojar. 2009. Towards English-Czech Parallel Valency Lexicon via Treebank Examples. In Proceedings of 8th Treebanks and Linguistic Theories Workshop(TLT), pages 185 195, Milano, Italy, December. David Kolovratník, Natalia Klyueva, and Ondřej Bojar. 2009. Statistical Machine Translation between Related and Unrelated Languages. In ITAT 2009 Information Technologies Applications and Theory, September. Kamil Kos and Ondřej Bojar. 2009. Evaluation of Machine Translation Metrics for Czech as the Target Language. Prague Bulletin of Mathematical Linguistics, 92:135 147. Ondřej Bojar, Pavel Straňák, Daniel Zeman, Gaurav Jain, Michal Hrušecký, Michal Richter, and Jan Hajič. 2009. English-Hindi Translation Obtaining Mediocre Results with Bad Data and Fancy Models. In Proceedings of the 7th International Conference On Natural Language Processing(ICON-2009), Hyderabad, India, December. NLP Association of India. Ondřej Bojar, David Mareček, Václav Novák, Martin Popel, Jan Ptáček, Jan Rouš, and Zdeněk Žabokrtský. 2009. English-Czech MT in 2008. In Proceedings of the Fourth Workshop on Statistical Machine Translation, Athens, Greece, March. Association for Computational Linguistics. Ondřej Odcházel and Ondřej Bojar. 2009. Computer Aided Translation Backed by Machine Translation. In Proceedings of the ASLIB International Conference Translating and the Computer 31, London, UK, November. Natalia Klyueva and Ondřej Bojar. 2008. UMC 0.1: Czech-Russian-English Multilingual Corpus. In Proc. of International Conference Corpus Linguistics, pages 188 195, October. Ondřej Bojar and Jan Hajič. 2008. Phrase-Based and Deep Syntactic English-to-Czech Statistical Machine Translation. In Proceedings of the Third Workshop on Statistical Machine Translation, pages 143 146, Columbus, Ohio, June. Association for Computational Linguistics. Ondřej Bojar, Pavel Straňák, and Daniel Zeman. 2008. English-Hindi Translation in 21 Days. In Proceedings of the 6th International Conference On Natural Language Processing(ICON-2008) NLP Tools Contest, Pune, 3

India, December. NLP Association of India. Ondřej Bojar, Miroslav Janíček, Zdeněk Žabokrtský, Pavel Češka, and Peter Beňa. 2008. CzEng 0.7: Parallel Corpus with Community-Supplied Translations. In Proceedings of the Sixth International Language Resources and Evaluation(LREC 08), Marrakech, Morocco, May. ELRA. Ondřej Bojar, Silvie Cinková, and Jan Ptáček. 2007. Towards English-to-Czech MT via Tectogrammatical Layer. In Proceedings of the Sixth International Workshop on Treebanks and Linguistic Theories(TLT 2007), Bergen, Norway, December. Philipp Koehn, Hieu Hoang, Alexandra Birch, Chris Callison-Burch, Marcello Federico, Nicola Bertoldi, Brooke Cowan, Wade Shen, Christine Moran, Richard Zens, Chris Dyer, Ondřej Bojar, Alexandra Constantin, and Evan Herbst. 2007. Moses: Open Source Toolkit for Statistical Machine Translation. In ACL 2007, Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics Companion Volume Proceedings of the Demo and Poster Sessions, pages 177 180, Prague, Czech Republic, June. Association for Computational Linguistics. Ondřej Bojar. 2007. English-to-Czech Factored Machine Translation. In Proceedings of the Second Workshop on Statistical Machine Translation, pages 232 239, Prague, Czech Republic, June. Association for Computational Linguistics. Ondřej Bojar and Zdeněk Žabokrtský. 2006. CzEng: Czech-English Parallel Corpus, Release version 0.5. Prague Bulletin of Mathematical Linguistics, 86:59 62. Václava Benešová and Ondřej Bojar. 2006. Czech Verbs of Communication and the Extraction of their Frames. In Text, Speech and Dialogue: 9th International Conference, TSD 2006, volume LNAI 3658, pages 29 36. Springer Verlag, September. Ondřej Bojar and Magdalena Prokopová. 2006. Czech-English Word Alignment. In Proceedings of the Fifth International Conference on Language Resources and Evaluation(LREC 2006), pages 1236 1239. ELRA, May. Ondřej Bojar, Evgeny Matusov, and Hermann Ney. 2006. Czech-English Phrase-Based Machine Translation. In FinTAL 2006, volume LNAI 4139, pages 214 224, Turku, Finland, August. Springer. Ondřej Bojar, Jiří Semecký, and Václava Benešová. 2005. VALEVAL: Testing VALLEX Consistency and Experimenting with Word-Frame Disambiguation. Prague Bulletin of Mathematical Linguistics, 83:5 17. Markéta Lopatková, Ondřej Bojar, Jiří Semecký, Václava Benešová, and Zdeněk Žabokrtský. 2005. Valency Lexicon of Czech Verbs VALLEX: Recent Experiments with Frame Disambiguation. In Václav Matoušek, Pavel Mautner, and Tomáš Pavelka, editors, Text, Speech and Dialogue: 8th International Conference, TSD 2005, Karlovy Vary, Czech Republic, September 12-15, 2005. Proceedings, volume LNAI 3658, pages 99 106. Springer Verlag, September. Ondřej Bojar, Cyril Brom, Milan Hladík, and Vojtěch Toman. 2005. The Project ENTs: Towards Modelling Human-like Artificial Agents. In Peter Vojtáš, Mária Bieliková, Bernadette Charron-Bost, and Ondrej Sýkora, editors, SOFSEM 2005 Communications, pages 111 122. Society for Computer Science, January. Ondřej Bojar, Petr Homola, and Vladislav Kuboň. 2005. Problémy recyklování systému automatického překladu. In Peter Vojtáš, editor, ITAT 2005 Information Technologies Applications and Theory, pages 335 344, Košice, Slovakia, September. University of P. J. Šafařík. Ondřej Bojar, Petr Homola, and Vladislav Kuboň. 2005. Problems Of Reusing An Existing MT System. In IJCNLP 2005- Companion Volume to the Proceedings of Conference including Posters/Demos and Tutorial Abstracts, pages 181 186, October. Ondřej Bojar and Jan Hajič. 2005. Extracting Translation Verb Frames. In Walther von Hahn, John Hutchins, and Christina Vertan, editors, Proceedings of Modern Approaches in Translation Technologies, workshop in conjunction with Recent Advances in Natural Language Processing(RANLP 2005), pages 2 6. Bulgarian Academy of Sciencies, September. Ondřej Bojar. 2005. Budování česko-anglického slovníku pro strojový překlad. In Peter Vojtáš, editor, ITAT 2005 Information Technologies Applications and Theory, pages 201 211, Košice, Slovakia, September. University of P. J. Šafařík. Ondřej Bojar, Petr Homola, and Vladislav Kuboň. 2005. An MT System Recycled. In Proceedings of MT Summit X, pages 380 387, September. Ondřej Bojar. 2004. Problems of Inducing Large Coverage Constraint-Based Dependency Grammar for Czech. In Constraint Solving and Language Processing, CSLP 2004, volume LNAI 3438, pages 90 103, Roskilde University, September. Springer. Ondřej Bojar. 2004. Czech Syntactic Analysis Constraint-Based, XDG: One Possible Start. Prague Bulletin of Mathematical Linguistics, 81:43 54. Ondřej Bojar. 2004. Automated Extraction of Lexico-Syntactic Information. In Jana Šafránková, editor, WDS 04 Proceedings of Contributed Papers: Part I- Mathematics and Computer Sciences, pages 211 217, Prague, June 15 18. Charles University, Matfyzpress. Ondřej Bojar. 2003. Towards Automatic Extraction of Verb Frames. Prague Bulletin of Mathematical Linguistics, 79 80:101 120. 4

Ondřej Bojar. 2003. Building Subcorpora Suitable for Extraction of Lexico-Syntactic Information. In Proceedings of the Student Session, ESSLLI, August. Ostatní Ondřej Bojar, Aleš Tamchyna, and Jan Berka. 2012. Wild Experimenting in Machine Translation. CLARA Winter School in Prague, January. Ondřej Bojar. 2012. Strojový překlad. Vesmír, 91:488 490, September. Ondřej Bojar, Mauro Cettolo, Silvie Cinková, Philipp Koehn, Miroslav Týnovský, and Zdeněk Žabokrtský. 2012. Scientific Report on Rich Tree-Based SMT. Project EuromatrixPlus- Deliverable 1.4, ÚFAL, Charles University, March. Ondřej Bojar and Aleš Tamchyna. 2011. Forms Wanted: Training SMT on Monolingual Data. Abstract at Machine Translation and Morphologically-Rich Languages. Research Workshop of the Israel Science Foundation University of Haifa, Israel, January. Petra Galuščáková and Ondřej Bojar. 2011. Czech-Slovak Parallel Corpora. In Proc. of Slovko 2011, October. Ondřej Bojar, Chris Callison-Burch, Jan Hajič, and Philipp Koehn, editors. 2009. Prague Bulletin of Mathematical Linguistics- Special Issue on Open Source Machine Translation Tools. Number 91 in Prague Bulletin of Mathematical Linguistics. Charles University, January. Ondřej Bojar and Miroslav Týnovský. 2009. Evaluation of Tree Transfer System. Project Euromatrix- Deliverable 3.4, ÚFAL, Charles University, March. Ondřej Bojar and Adam Lopez. 2008. Tree-based Translation. Handout for MT Marathon Tutorial, May. Zdeněk Žabokrtský and Ondřej Bojar. 2008. TectoMT, Developer s Guide. Technical Report TR-2008-39, Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague, December. Ondřej Bojar, Miroslav Janíček, and Miroslav Týnovský. 2008. Implementation of Tree Transfer System. Project Euromatrix- Deliverable 3.3, ÚFAL, Charles University, September. Ondřej Bojar and Magdalena Prokopová. 2007. Czech-English Machine Translation Dictionary. Technical report, ÚFAL MFF UK, Prague, Czech Republic, April. Ondřej Bojar. 2006. Strojový překlad: zamyšlení nad účelností hloubkových jazykových analýz. In MIS 2006, pages 3 13, Josefův Důl, Czech Republic, January. MATFYZPRESS. Philipp Koehn, Marcello Federico, Wade Shen, Nicola Bertoldi, Ondřej Bojar, Chris Callison-Burch, Brooke Cowan, Chris Dyer, Hieu Hoang, Richard Zens, Alexandra Constantin, Christine Moran, and Evan Herbst. 2006. Open Source Toolkit for Statistical Machine Translation: Factored Translation Models and Confusion Network Decoding. Technical report, Johns Hopkins University, Center for Speech and Language Processing, August. Ondřej Bojar, Jiří Semecký, Shravan Vasishth, and Ivana Kruijff-Korbayová. 2004. Processing noncanonical word order in Czech. In Proceedings of Architectures and Mechanisms for Language Processing, AMLaP 2004, pages 91 91, Université de Provence, September 16-18. Ondřej Bojar, Cyril Brom, Milan Hladík, Mikuláš Vejlupek, Vojtěch Toman, and David Voňka. 2003. ENTI Simulátor přirozeného prostředí lidského světa. In MIS 2003, pages 3 14. MATFYZPRESS, January 18 25, 2003. Ondřej Bojar. 2003. AX- Systém pro automatizovanou extrakci lexikálně-syntaktických údajů. In MIS 2003, pages 15 24. MATFYZPRESS, January 18 25. VPrazedne13.února2013, Ondřej Bojar 5